根据异常检测创建 CloudWatch 警报
您可以根据 CloudWatch 异常检测来创建警报,该警报可以挖掘过去的指标数据并创建预期值模型。预期值会考虑指标中的典型每小时、每日和每周模式。
您需要为异常检测阈值设置一个值,然后 CloudWatch 在模型中使用该阈值来确定指标值的“正常”范围。阈值越高,所产生的“正常”值的范围越大。
您可以选择当指标值高于预期值范围或低于预期值范围时是否触发警报。
有关更多信息,请参阅 使用 CloudWatch 异常检测。
注意
如果您在指标控制台中用于可视化目的的异常检测指标上创建异常检测警报,则您为警报设置的阈值不会更改您已用于可视化的阈值。有关更多信息,请参阅 创建图表。
根据异常检测创建警报
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/。
-
在导航窗格中,依次选择 Alarms 和 Create Alarm。
-
选择选择指标并执行以下操作之一:
-
选择包含所需指标的服务命名空间。要缩小选择范围,请继续选择所显示的选项。在显示指标列表时,选中所需的指标旁边的复选框。
-
在搜索框中,输入指标名称、维度或资源 ID,然后按 Enter。接下来,选择其中的一个结果并继续,直到显示一个指标列表。选中所需的指标旁边的复选框。
-
-
选择 Graphed metrics 选项卡。
-
在统计数据下面,选择其中的一个统计数据或预定义百分比值,或者指定一个自定义百分比值(例如
p95.45
)。 -
在时间段下,选择警报的评估期。评估警报时,每个时间段聚合到一个数据点。对于异常检测警报,该值必须是一分钟或更长时间。
在创建警报时,您还可以选择是在左侧还是右侧显示 Y 轴图例。该首选项仅在创建警报时使用。
-
选择选择指标。
将显示指定指标和条件页面,其中显示一个图表以及有关您选择的指标和统计数据的其他信息。
-
-
在条件下面,指定以下内容:
-
选择 Anomaly detection (异常检测)。
如果针对此指标和统计数据的模型已存在,则 CloudWatch 在屏幕顶部的示例图中显示异常检测范围。如果该模型尚不存在,则在创建完警报后将生成模型。模型生成的实际异常检测范围需要长达 15 分钟才能显示在图表中。在此之前,您看到的范围是异常检测范围的近似值。要在更长的时间范围内查看图表,请选择页面右上方的编辑。
-
对于 Whenever
metric
is (每当指标为),指定该指标是否必须大于、小于或超出(在任一方向)范围才会触发警报。 -
对于 Anomaly detection threshold (异常检测阈值),请选择用于异常检测阈值的数字。一个较大的数会创建一个较大的“正常”值范围,这将更能容忍指标的变化;一个较小的数会创建一个较小的范围,它将以较小的指标偏差进入
ALARM
状态。数字不一定是整数。 -
选择其他配置。对于触发警报的数据点数,指定必须有多少个评估期(数据点)处于
ALARM
状态才能触发警报。如果此处的两个值匹配,则会创建一个警报;如果多个连续评估期超出阈值,该警报将变为ALARM
状态。要创建“M (最大为 N)”警报,为第一个值指定的数字应小于为第二个值指定的数字。有关更多信息,请参阅评估警报。
-
对于缺失数据处理,选择在缺失某些数据点时的警报行为。有关更多信息,请参阅配置 CloudWatch 警报处理缺失数据的方式。
-
如果警报将百分比值作为监控的统计数据,将显示样本数少的百分比框。使用它来选择是评估还是忽略采样率低的案例。如果选择忽略 (保持警报状态),在样本大小太小时,将始终保持当前警报状态。有关更多信息,请参阅基于百分位数的 CloudWatch 警报和小数据样本。
-
-
选择 Next。
-
在通知下面,选择一个在警报处于
ALARM
、OK
或INSUFFICIENT_DATA
状态时通知的 SNS 主题。要让警报为相同警报状态或不同警报状态发送多个通知,请选择添加通知。
要让警报不发送通知,请选择删除。
-
要让警报执行 EC2 操作,请选择相应的按钮,然后选择警报状态和要执行的操作。
-
在完成后,选择下一步。
-
输入警报的名称和说明。名称只能包含 ASCII 字符。然后选择 Next。
-
在预览和创建下面,确认具有所需的信息和条件,然后选择创建警报。
修改异常检测模型
创建警报后,您可以调整异常检测模型。您可以排除某些时间段,不在创建模型时使用。从训练数据中排除系统中断、部署和假日等异常事件至关重要。您还可以指定是否针对夏令时更改调整模型。
针对警报调整异常检测模型
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/。
-
在导航窗格中,选择 Alarms。
-
选择警报的名称。如有必要,请使用搜索框查找警报。
-
选择 View in metrics (查看指标)。
-
在屏幕的下部分中,选择 Edit model (编辑模型)。
-
要排除用于生成模型的时间段,请选择 Add another time range to exclude from training (添加要从训练中排除的另一个时间范围)。然后,选择或输入要从训练中排除的天数和时间,并选择 Apply (应用)。
-
如果指标对夏令时变化敏感,请在 Metric timezone (指标时区) 框中选择相应的时区。
-
选择 Update (更新)。
删除异常检测模型
对警报使用异常检测会产生 AWS 费用。如果您不再需要针对某个警报的异常检测模型,则应依次删除警报和模型。如果您删除模型而不删除警报,则警报会自动重新创建模型。
删除警报
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/。
-
在导航窗格中,选择 Alarms。
-
选择警报的名称。
-
依次选择 Actions 和 Delete。
删除已用于警报的异常检测模型
-
通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/。
-
在导航窗格中,选择 Metrics。
-
在 All metrics (所有指标) 选项卡上的搜索字段中,输入搜索词(例如,指标名称或资源名称),然后按 Enter。
例如,如果您搜索
CPUUtilization
指标,则将显示具有该指标的命名空间和维度。 -
在结果中,选择具有异常检测模型的指标。
-
选择 Graphed metrics 选项卡。
-
在屏幕的下部分中,依次选择 Edit model (编辑模型) 和 Delete model (删除模型)。