Amazon CloudWatch
用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

根据异常检测创建 CloudWatch 警报

CloudWatch anomaly detection is in open preview. The preview is open to AWS accounts in all commercial AWS Regions except 亚太地区(香港), AWS GovCloud (US), 中国(北京)区域, and 中国 (宁夏) 区域. You do not need to request access. Features may be added or changed before announcing General Availability. Please contact anomalydetectionfeedback@amazon.com for any feedback, questions, or if you would like to be informed when updates are available.

您可以根据 CloudWatch 异常检测来创建标准分辨率警报,该警报可以挖掘过去的指标数据并创建预期值模型。预期值会考虑指标中的典型每小时、每日和每周模式。

您指定了一些标准偏差,CloudWatch 将这些标准偏差与模型结合使用来确定指标的“正常”值范围,标准偏差越多,“正常”值的范围就越大。

您可以选择当指标值高于预期值范围或低于预期值范围时是否触发警报。

有关更多信息,请参阅 CloudWatch 异常检测

注意

如果您在指标控制台中用于可视化目的的异常检测指标上创建异常检测警报,则您为警报设置的阈值不会更改您已用于可视化的阈值。有关更多信息,请参阅 创建图表

根据异常检测创建警报

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 在导航窗格中,依次选择 AlarmsCreate Alarm

  3. 选择选择指标并执行以下操作之一:

    • 选择包含所需指标的服务命名空间。要缩小选择范围,请继续选择所显示的选项。在显示指标列表时,选中所需的指标旁边的复选框。

    • 在搜索框中,输入指标名称、维度或资源 ID,然后按 Enter。接下来,选择其中的一个结果并继续,直到显示一个指标列表。选中所需的指标旁边的复选框。

  4. 选择 Graphed metrics 选项卡。

    1. 统计数据下面,选择其中的一个统计数据或预定义百分比值,或者指定一个自定义百分比值(例如 p95.45)。

    2. 时间段下,选择警报的评估期。评估警报时,每个时间段聚合到一个数据点。对于异常检测警报,该值必须是一分钟或更长时间。

      在创建警报时,您还可以选择是在左侧还是右侧显示 Y 轴图例。该首选项仅在创建警报时使用。

    3. 选择选择指标

      将显示指定指标和条件页面,其中显示一个图表以及有关您选择的指标和统计数据的其他信息。

  5. 条件下面,指定以下内容:

    1. 选择 Anomaly detection (异常检测)

      如果针对此指标和统计数据的模型已存在,则 CloudWatch 在屏幕顶部的示例图中显示异常检测范围。如果该模型尚不存在,则在创建完警报后将生成模型。模型生成的实际异常检测范围需要长达 15 分钟才能显示在图表中。在此之前,您看到的范围是异常检测范围的近似值。

    2. 对于 Whenever metric is (每当指标为),指定该指标是否必须大于、小于或超出(在任一方向)范围才会触发警报。

    3. 对于 Anomaly detection threshold (异常检测阈值),选择用于创建将用作正常值范围的范围的标准偏差数。选择一个较大的数会创建一个较大的范围,这将更能容忍指标的变化,选择一个较小的数会创建一个较小的范围,它将以较小的指标偏差进入 ALARM 状态。

    4. 选择其他配置。对于触发警报的数据点数,指定必须有多少个评估期(数据点)处于 ALARM 状态才能触发警报。如果此处的两个值匹配,则会创建一个警报;如果多个连续评估期超出阈值,该警报将变为 ALARM 状态。

      要创建“M (最大为 N)”警报,为第一个值指定的数字应小于为第二个值指定的数字。有关更多信息,请参阅评估警报

    5. 对于缺失数据处理,选择在缺失某些数据点时的警报行为。有关更多信息,请参阅配置 CloudWatch 警报处理缺失数据的方式

    6. 如果警报将百分比值作为监控的统计数据,将显示样本数少的百分比框。使用它来选择是评估还是忽略采样率低的案例。如果选择忽略 (保持警报状态),在样本大小太小时,将始终保持当前警报状态。有关更多信息,请参阅基于百分位数的 CloudWatch 警报和小数据样本

  6. 选择 Next

  7. 通知下面,选择一个在警报处于 ALARMOKINSUFFICIENT_DATA 状态时通知的 SNS 主题。

    要让警报为相同警报状态或不同警报状态发送多个通知,请选择添加通知

    要让警报不发送通知,请选择删除

  8. 要让警报执行 Auto Scaling 或 EC2 操作,请选择相应的按钮,然后选择警报状态和要执行的操作。

  9. 在完成后,选择下一步

  10. 输入警报的名称和说明。名称只能包含 ASCII 字符。然后选择 Next

  11. 预览和创建下面,确认具有所需的信息和条件,然后选择创建警报

修改异常检测模型

创建警报后,您可以调整异常检测模型。您可以在模型创建中排除某些时间段,并且可以指定是否调整模型以适应夏令时更改。

您可以选择排除过去和将来的时间段。

针对警报调整异常检测模型

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 在导航窗格中,选择 Alarms

  3. 选择警报的名称。如有必要,请使用搜索框查找警报。

  4. 选择 View in metrics (查看指标)

  5. 在屏幕的下部分中,选择 Edit model (编辑模型)

  6. 要排除用于生成模型的时间段,请选择 Add another time range to exclude from training (添加要从训练中排除的另一个时间范围)。然后,选择或输入要从训练中排除的天数和时间,并选择 Apply (应用)

  7. 如果指标对夏令时变化敏感,请在 Metric timezone (指标时区) 框中选择相应的时区。

  8. 选择 Update (更新)

删除异常检测模型

对警报使用异常检测会产生 AWS 费用。如果您不再需要针对某个警报的异常检测模型,则应依次删除警报和模型。如果您删除模型而不删除警报,则警报会自动重新创建模型。

删除警报

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 在导航窗格中,选择 Alarms

  3. 选择警报的名称。

  4. 依次选择 ActionsDelete

删除已用于警报的异常检测模型

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 在导航窗格中,选择 Metrics

  3. All metrics (所有指标) 选项卡上的搜索字段中,输入搜索词(例如,指标名称或资源名称),然后按 Enter。

    例如,如果您搜索 CPUUtilization 指标,则将显示具有该指标的命名空间和维度。

  4. 在结果中,选择具有异常检测模型的指标。

  5. 选择 Graphed metrics 选项卡。

  6. 在屏幕的下部分中,依次选择 Edit model (编辑模型)Delete model (删除模型)