将 Amazon CloudWatch 用于 ARC 中的就绪检查 - Amazon 应用程序恢复控制器 (ARC)
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

将 Amazon CloudWatch 用于 ARC 中的就绪检查

Amazon 应用程序控制恢复器(ARC)向 Amazon CloudWatch 发布就绪检查的数据点。利用 CloudWatch,您可以按一组有序的时间序列数据(称为指标)来检索关于这些数据点的统计数据。可将指标视为要监控的变量,而将数据点视为该变量随时间变化的值。例如,您可以监控在指定时间段内通过 Amazon 区域的流量。每个数据点都有相关联的时间戳和可选测量单位。

您可使用指标来验证系统是否正常运行。例如,您可以创建 CloudWatch 警报来监控指定的指标,并在指标超出您的可接受范围时启动某个操作(如向电子邮件地址发送通知)。

有关更多信息,请参阅《Amazon CloudWatch 用户指南》。

ARC 指标

AWS/Route53RecoveryReadiness 命名空间包括以下指标。

指标 描述
ReadinessChecks

表示 ARC 处理的就绪检查的数量。该指标可以按状态确定维度,如下所示。

单位Count

报告标准:有非零值。

统计数据:唯一有用的统计数据是 Sum

维度
  • READY

  • NOT_READY

  • NOT_AUTHORIZED

  • UNKNOWN

Resources

表示 ARC 处理的资源数量,可以根据 API 定义的资源标识符来确定维度。

单位Count

报告标准:有非零值。

统计数据:唯一有用的统计数据是 Sum

维度
  • ResourceSetType:这些是资源类型,按 ARC 评估的每种给定类型的资源数量进行筛选

    例如:AWS::CloudWatch::Alarm

ARC 指标的统计数据

CloudWatch 基于 ARC 发布的指标数据点提供统计数据。统计数据是在指定的时间段内汇总的指标数据。当请求统计数据时,返回的数据流按指标名称和维度进行识别。维度是用于唯一标识指标的名称/值对。

以下是您可能认为有用的指标/维度组合示例:

  • 查看 ARC 为评估就绪情况而进行的就绪检查数量。

  • 查看 ARC 评估的给定资源集类型的资源总数。

查看 ARC 中的 CloudWatch 指标

您可以使用 CloudWatch 控制台或 Amazon CLI 查看 ARC 的 CloudWatch 指标。在控制台中,这些指标显示为监控图表。

您必须在控制台中或使用 Amazon CLI 时查看美国西部(俄勒冈州)区域中 ARC 的 CloudWatch 指标。使用 Amazon CLI 时,请通过加入以下参数为您的命令指定美国西部(俄勒冈州)区域:--region us-west-2

使用 CloudWatch 控制台查看指标
  1. 通过以下网址打开 CloudWatch 控制台:https://console.aws.amazon.com/cloudwatch/

  2. 在导航窗格中,选择指标

  3. 选择 Route53RecoveryReadiness 命名空间。

  4. (可选) 要跨所有维度查看某个指标,请在搜索字段中键入其名称。

使用 查看指标Amazon CLI

使用以下 list-metrics 命令列出可用指标:

aws cloudwatch list-metrics --namespace AWS/Route53RecoveryReadiness --region us-west-2
使用 Amazon CLI 获取指标的统计数据

使用以下 get-metric-statistics 命令获取指定指标和维度的统计数据。请注意 CloudWatch 将不同维度的每种唯一组合视为一个单独的指标。您无法使用未专门发布的维度组合检索统计数据。您必须指定创建指标时使用的同一维度。

以下示例列出了 ARC 中某账户每分钟评估的就绪检查总数。

aws cloudwatch get-metric-statistics --namespace AWS/Route53RecoveryReadiness \ --metric-name ReadinessChecks \ --region us-west-2 \ --statistics Sum --period 60 \ --dimensions Name=State,Value=READY \ --start-time 2021-07-03T01:00:00Z --end-time 2021-07-03T01:20:00Z

下面是该命令的示例输出:

{ "Label": "ReadinessChecks", "Datapoints": [ { "Timestamp": "2021-07-08T18:00:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:04:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:01:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:02:00Z", "Sum": 1.0, "Unit": "Count" }, { "Timestamp": "2021-07-08T18:03:00Z", "Sum": 1.0, "Unit": "Count" } ] }