使用 CloudWatch 警报进行监控 - Application Auto Scaling
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 CloudWatch 警报进行监控

您可以创建警报,以在 Amazon CloudWatch 检测到可能需要您注意的任何问题时通知您。

CloudWatch 警报会监控一个指标。该警报仅当状态发生变化并且已持续您指定的时间段时才会触发一个或多个操作。例如,您可以设置一个警报以在指标值低于或超过特定水平时通知您,从而确保在潜在问题出现之前您就得到通知。

CloudWatch 还允许您设置警报,当指标处于 INSUFFICIENT_DATA 状态时通知您。任何 Amazon 服务的任何指标均可对 INSUFFICIENT_DATA 发出警报。这是新警报的初始状态,但如果 CloudWatch 指标变为不可用,或没有足够的数据可用于指标以确定警报状态时,警报状态也会变为 INSUFFICIENT_DATA。例如,仅当 Lambda 函数处于活动状态时,Amazon Lambda 才会每分钟向 CloudWatch 发出一次 ProvisionedConcurrencyUtilization 指标。如果函数处于非活动状态,则会导致警报在等待指标时进入 INSUFFICIENT_DATA 状态。这是正常的,可能不一定意味着存在问题,但如果您预期在一段时间内进行活动,但没有任何活动,则可能表明存在问题。

本主题介绍如何创建警报,以在指标处于您定义的阈值范围之内或之外时或数据不足时发送通知。有关更多详细信息,请参阅 Amazon CloudWatch 用户指南中的使用 Amazon CloudWatch 警报

创建发送电子邮件的警报
  1. 通过以下网址打开 CloudWatch 控制台:https://console.aws.amazon.com/cloudwatch/

  2. 在导航窗格中,依次选择 AlarmsCreate Alarm

  3. 选择 Select Metric(选择指标)

    系统会将您导向到可在其中找到所有指标的页面。可用指标的类型取决于您使用的服务和功能。指标的分组首先依据服务命名空间,然后依据每个命名空间内的各种维度组合。

  4. 选择一个指标命名空间(例如 Lambda),然后选择一个指标维度(例如 By Function Name [按函数名称])。

    All metrics(所有指标)选项卡显示所选维度和命名空间的所有指标。

  5. 选中您要为其创建警报的指标旁边的复选框,然后选择 Select metric(选择指标)

  6. 按如下所示配置警报,然后选择 Next(下一步)

    • Metric(指标)下,选择 1 minute5 minutes 的汇总期。如果您使用一分钟作为某个指标的汇总期,则每分钟具有一个数据点。周期越短,创建的警报越敏感。

    • Conditions(条件)下,配置您的阈值,例如,生成通知之前指标必须超过的值。

    • Additional configuration(其他配置)下,对于 Datapoints to alarm(触发警报的数据点数),输入指标值必须满足阈值条件才会触发警报的数据点(评估时间段)数。例如,2 个连续的 5 分钟时间段需要花 10 分钟才会触发警报。

    • 对于 Missing data treatment(缺失数据处理),保留默认值并将缺失的数据点处理为缺失。

      某些指标仅在发生活动时报告。这可能会导致报告稀疏的指标。如果指标在设计上经常缺少数据点,则在这些期间警报的状态为 INSUFFICIENT_DATA。要强制警报保持之前的 ALARMOK 状态以防止警报摆动,您可以选择忽略缺少的数据。

  7. Notification(通知)下,选择警报处于 ALARMOKINSUFFICIENT_DATA 状态时通知的 SNS 主题。要使告警为相同告警状态或不同告警状态发送多个通知,请选择 Add notification(添加通知)

  8. 在完成后,选择下一步

  9. 输入警报的名称和描述(可选),然后选择 Next (下一步)

  10. 选择Create alarm(创建警报)

检查警报的状态
  1. 通过以下网址打开 CloudWatch 控制台:https://console.aws.amazon.com/cloudwatch/

  2. 在导航窗格中,选择 Alarms(告警)以查看警报列表。

  3. 要筛选警报,请使用搜索字段旁边的下拉筛选器,然后选择要应用的筛选选项。

  4. 要编辑或删除警报,请选择警报,然后选择 Actions(操作)Edit(编辑)Actions(操作)Delete(删除)