Amazon Elastic Compute Cloud
用户指南(适用于 Linux 实例)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

使用 CloudWatch 指标监控 Amazon EI

您可以使用 Amazon CloudWatch 监控 Amazon EI 加速器,这会收集有关您的使用情况和性能的指标。这些统计数据会保存两周,以便您访问历史信息并更好地了解服务的运行情况。

默认情况下,Amazon EI 每隔 5 分钟向 CloudWatch 发送一次指标数据。

有关更多信息,请参阅 Amazon CloudWatch 用户指南

Amazon EI 指标与维度

指标的分组首先依据服务命名空间,然后依据每个命名空间内的各种维度组合。您可以按照以下步骤查看 Amazon EI 的各项指标。

使用 CloudWatch 控制台查看指标

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 如果需要,可以更改区域。从导航栏中,选择您的 Amazon EI 所在的区域。有关更多信息,请参阅 Regions and Endpoints

  3. 在导航窗格中,选择 Metrics

  4. All metrics 下,选择指标类别,然后向下滚动以查看指标的完整列表。

查看指标 (AWS CLI)

  • 在命令提示符处,输入以下命令:

    aws cloudwatch list-metrics --namespace " AWS/ElasticInference "

CloudWatch 显示 Amazon EI 的以下指标。

指标 描述
                   

AcceleratorHealthCheckFailed

               
                   

报告 Amazon EI 加速器在上一分钟

是否通过了运行状况检查。值为

零 (0) 表示状况检查已通过。值为一 (1) 表示状态检查失败。

单位:计数

               
                   

ConnectivityCheckFailed

               
                   

报告与 Amazon EI 加速器的连接在上一分钟处于活动状态还是已失败。值为零 (0) 表示连接处于活动状态。值为一 (1) 表示连接故障。

单位:计数

               
                   

AcceleratorMemoryUsage

               
                   

Amazon EI 加速器在上一分钟使用的内存。

单位:字节

               

您可以使用以下维度筛选 Amazon EI 数据。

维度 描述
                   

ElasticInferenceAcceleratorId

               
                   

该维度按 Amazon EI 加速器筛选数据。

               
                   

实例 ID

               
                   

该维度按 Amazon EI 加速器附加到的实例筛选数据。

               

创建 CloudWatch 警报以监控 Amazon EI

您可以创建 CloudWatch 警报,用于在警报改变状态时发送 Amazon SNS 消息。警报会监控您指定的时间段内的某个指标。它将根据指标值在多个时间段内相对于给定阈值的情况向 SNS 主题发送通知。

例如,您可以创建一个监控 Amazon EI 加速器运行状况的警报。如果 Amazon EI 加速器在 3 个连续的 5 分钟周期内未能通过运行状况检查,则它将发送通知。

创建 Amazon EI 加速器运行状况警报

  1. 通过以下网址打开 CloudWatch 控制台:https://console.amazonaws.cn/cloudwatch/

  2. 在导航窗格中,依次选择 AlarmsCreate Alarm

  3. 选择 Amazon EI 指标

  4. 选择 Amazon EIAcceleratorHealthCheckFailed 指标,然后选择下一步

  5. 按如下所示配置警报,然后选择 Create Alarm (创建警报)

    • 警报阈值下,输入名称和说明。对于每当,选择 => 并输入 1。对于连续周期,输入 3

    • 操作下,选择现有通知列表,或者选择新建列表

    • Alarm Preview 下,选择以 5 分钟为周期。