使用 Amazon CloudWatch 监控 Run Command 指标
指标是 Amazon CloudWatch 中的基本概念。指标表示一个发布到 CloudWatch 并且按时间排序的数据点集。可将指标视为要监控的变量,而数据点代表该变量随时间变化的值。
Amazon Systems Manager 会将与 Run Command 命令的状态有关的指标发布到 CloudWatch,使您能够根据这些指标设置告警。Run Command 是 Amazon Systems Manager 的一项功能。这些统计数据会被长时间记录,以便您可以访问历史信息并更好地了解 Amazon Web Services 账户中命令运行的成功率。
可以跟踪其指标的命令的终端状态值包括 Success
、Failed
和 Delivery Timed Out
。例如,对于设置为每小时运行一次的 SSM Command 文档,您可以配置告警,以便在其中任何一小时未报告 Success
的状态时向您发送通知。有关命令状态值的更多信息,请参阅 了解命令状态。
在 CloudWatch 控制台中查看指标
访问 https://console.aws.amazon.com/cloudwatch/
打开 CloudWatch 控制台。 -
在导航窗格中,选择指标。
-
在按 Amazon 服务告警区域,对于服务,选择 SSM-Run Command。
使用 Amazon CLI 查看指标
打开命令提示符窗口并使用以下命令。
aws cloudwatch list-metrics --namespace "AWS/SSM-RunCommand"
要列出所有可用的指标,请使用以下命令。
aws cloudwatch list-metrics
Systems Manager Run Command 指标和维度
Systems Manager 每分钟向 CloudWatch 发送一次 Run Command 命令指标。
Systems Manager 将以下命令指标发送到 CloudWatch。
注意
这些指标使用 Count
作为单位,因此 Sum
和 SampleCount
是最有用的统计数据。
指标 | 描述 |
---|---|
CommandsDeliveryTimedOut
|
终端状态为 Delivery Timed Out 的命令的数量。 |
CommandsFailed
|
终端状态为 Failed 的命令的数量。 |
CommandsSucceeded
|
终端状态为 Success 的命令的数量。 |
有关使用 CloudWatch 指标的更多信息,请参阅 Amazon CloudWatch 用户指南中的以下主题: