Amazon CloudWatch
用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Amazon EC2 指标与维度

Amazon Elastic Compute Cloud (Amazon EC2) 将向 CloudWatch 发送 EC2 实例的指标。默认情况下启用基本监控 (5 分钟)。您可以启用详细监控 (1 分钟)。有关 Auto Scaling 组中 Amazon EC2 实例的其他指标的信息,请参阅 Amazon EC2 Auto Scaling 指标与维度

有关如何监控 Amazon EC2 的更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例) 中的使用 CloudWatch 监控您的实例

关于 C5 和 M5 实例的指标收集与计算

C5 和 M5 实例使用 Nitro 管理程序,因此它们以与其他使用基于 Xen 的管理程序的实例不同的方式发布 CloudWatch 指标。有关更多信息,请参阅 Nitro Hypervisor

在对 EC2 实例进行基本监控时,可以以五分钟一次的频率获取七个预选指标。当您对任何类型的 EC2 实例 (使用任意管理程序) 使用基本监控时,管理程序在每个五分钟的时间间隔内测量每个指标的五个独立样本。这些数据点发布到 CloudWatch 的方式取决于实例所用管理程序的类型。

  • 在 Xen 实例上,这五个样本在五分钟间隔结束时汇总并作为一个数据点报告给 CloudWatch,其具有对应于此五分钟间隔开始时间的时间戳。此数据点的统计数据集包括值为 5 的 SampleCount

  • 在 Nitro 实例上,在间隔期间取得第一个样本后立即将数据点发布到 CloudWatch。间隔期间每次取得后续样本时,更新此数据点的统计数据集,以反映到目前为止采集的所有样本,但时间戳保持不变。如果您正在绘制或监控报告的数据,则当前数据点的统计数据可能会在五分钟间隔内取得每个样本时发生变化。间隔期间采集的五个样本中的每一个都包含在 SampleCount 统计数据中。

时间

1:01PM

1:02PM

1:03PM

1:04PM

1:05PM

示例值

10

15

10

5

10

在 Xen 实例上发布 (启用基本监控)

Average=10

Sum=50

Minimum=5

Maximum=15

SampleCount=5

Timestamp=1:00PM

在 Nitro 实例上发布 (启用基本监控)

Average=10

Sum=10

Minimum=10

Maximum=10

SampleCount=1

Timestamp=1:00PM

Average=12.5

Sum=25

Minimum=10

Maximum=15

SampleCount=2

Timestamp=1:00PM

Average=11.666

Sum=35

Minimum=10

Maximum=15

SampleCount=3

Timestamp=1:00PM

Average=10

Sum=40

Minimum=5

Maximum=15

SampleCount=4

Timestamp=1:00PM

Average=10

Sum=50

Minimum=5

Maximum=15

SampleCount=5

Timestamp=1:00PM

在上表所示的示例中,使用的是基本监控。在五分钟间隔内,每分钟采样一次。在基于 Xen 的实例上,五分钟间隔结束前,不发布任何信息。在 1:05PM,系统汇总五个样本并写入一个数据点,时间戳为 1:00PM。此数据点的 SampleCount 为 5。此数据点为指标的 Sum 统计数据贡献 50。

在 Nitro 实例上,数据点首先在 1:01PM 写入 CloudWatch,时间戳为 1:00PM,值为 10。在 1:02PM,值为 15 的新样本导致 1:00PM 数据点的平均值更改为 12.5 (两个样本的平均值)。这也使得最大值更改为 15。此数据点的时间戳仍为 1:00PM。在 1:03PM 时,数据点平均值更改为 11.6。最后,在 1:05PM 提交最后一个样本后,平均值恢复为 10。此数据点的最终平均值统计数据为 10,但它为 Sum 贡献了 50,因为这五分钟的时间段包括一个值为 5 的 SampleCount,并且 Sum 包含五个样本中的每一个。MinimumMaximum 值反映间隔期间采样的最大值和最小值。

考虑到 Nitro 实例收集和计算数据的方式,建议只设置具有两个或更多个评估周期或要求“M/N”违例周期 (其中 M 至少为 2) 的警报。这是因为在 Nitro 实例上,可能会发生以下情况:五分钟期间内的某个样本导致数据点暂时违反阈值,而此期间的后续样本使此数据点指向的最终统计数据集符合阈值要求。当前样本中的这个“可变”数据点可能导致警报在间隔内激活。有关更多信息,请参阅评估警报

Amazon EC2 指标

默认情况下,在每个 EC2 实例中提供了以下指标。您可以在实例上安装 CloudWatch 代理以启用其他指标。有关在实例上安装 CloudWatch 代理的更多信息,请参阅使用 CloudWatch 代理从 Amazon EC2 实例和本地服务器收集指标和日志。有关可收集的其他指标的更多信息,请参阅CloudWatch 代理收集的指标

AWS/EC2 命名空间包括您的 T2 实例的以下 CPU 积分指标。

指标 描述
CPUCreditUsage

[T2 实例] 实例为保持 CPU 使用率而花费的 CPU 积分数。一个 CPU 积分等于一个 vCPU 按 100% 利用率运行一分钟,或者 vCPU、利用率和时间的等效组合(例如, 一个 vCPU 按 50% 利用率运行两分钟,或者两个 vCPU 按 25% 利用率运行两分钟)。

CPU 积分指标仅每 5 分钟提供一次。如果您指定一个大于五分钟的时间段,请使用Sum 统计数据,而非 Average 统计数据。

单位:积分 (vCPU 分钟)

CPUCreditBalance

[T2 实例] 实例自启动后已累积获得的 CPU 积分数。对于 T2 标准,CPUCreditBalance 还包含已累积的启动积分数。

在获得积分后,积分将在积分余额中累积;在花费积分后,将从积分余额中扣除积分。积分余额具有最大值限制,这是由实例大小决定的。在达到限制后,将丢弃获得的任何新积分。对于 T2 标准,启动积分不计入限制。

实例可以花费 CPUCreditBalance 中的积分,以便突增到基准 CPU 使用率以上。

在实例运行过程中,CPUCreditBalance 中的积分不会过期。在实例停止时,CPUCreditBalance 不会保留,并且所有累积的积分都将丢失。

CPU 积分指标仅每 5 分钟提供一次。

单位:积分 (vCPU 分钟)

CPUSurplusCreditBalance

[T2 无限实例] 在 CPUCreditBalance 为零时,“T2 无限”实例花费的超额积分数。

CPUSurplusCreditBalance 由获得的 CPU 积分支付。如果超额积分数超出实例可在 24 小时周期内获得的最大积分数,则超出最大积分数的已花费超额积分将产生额外费用。

单位:积分 (vCPU 分钟)

CPUSurplusCreditsCharged

[T2 无限实例] 未由获得的 CPU 积分支付并且会产生额外费用的已花费超额积分数。

在出现以下任一情况时,将对花费的超额积分收费:

  • 花费的超额积分超出实例可在 24 小时周期内获得的最大积分数。对于超出最大积分数的所花费超额积分,将在该小时结束时向您收费。

  • 实例已停止或终止。

  • 实例已从“无限制”切换到“标准”。

单位:积分 (vCPU 分钟)

AWS/EC2 命名空间包括以下实例指标。

指标 描述

CPUUtilization

当前正在实例上使用的已分配 EC2 计算单位的百分率。该指标确认在选定实例上运行一个应用程序需要的处理能力。

若要使用百分位数统计数据,必须启用详细监控。

根据实例类型,如果未向实例分配整个处理器核心,则操作系统中的工具显示的百分率可能低于 CloudWatch。

单位:百分比

DiskReadOps

在指定时间段内从可供实例使用的所有实例存储卷完成的读取操作数。

要计算该周期的每秒平均 I/O 操作数 (IOPS),请将该周期的总操作数除以总秒数。

单位:计数

DiskWriteOps

在指定时间段内向可供实例使用的所有实例存储卷完成的写入操作数。

要计算该周期的每秒平均 I/O 操作数 (IOPS),请将该周期的总操作数除以总秒数。

单位:计数

DiskReadBytes

从可供实例使用的所有实例存储卷读取的字节数。

该指标用来确定应用程序从实例的硬盘读取的数据量。它可以用来确定应用程序的速度。

报告的数量是该期间内接收的字节数。如果您使用的是基本 (5 分钟) 监控,则可以将此数字除以 300 以获得字节/秒。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

DiskWriteBytes

向可供实例使用的所有实例存储卷写入的字节数。

该指标用来确定应用程序向实例的硬盘写入的数据量。它可以用来确定应用程序的速度。

报告的数量是该期间内接收的字节数。如果您使用的是基本 (5 分钟) 监控,则可以将此数字除以 300 以获得字节/秒。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

NetworkIn

实例在所有网络接口上收到的字节数。此指标用于确定流向单个实例的传入网络流量。

报告的数量是该期间内接收的字节数。如果您使用的是基本 (5 分钟) 监控,则可以将此数字除以 300 以获得字节/秒。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

NetworkOut

实例在所有网络接口上发送的字节数。此指标用于确定来自单个实例的传出网络流量。

报告的数字是该时间段内发送的字节数。如果您使用的是基本 (5 分钟) 监控,则可以将此数字除以 300 以获得字节/秒。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

NetworkPacketsIn

实例在所有网络接口上收到的数据包的数量。此指标依据单个实例上的数据包数量来标识传入流量的量。此指标仅对基本监控可用。

单位:计数

统计数据:Minimum、Maximum、Average

NetworkPacketsOut

实例在所有网络接口上发送的数据包的数量。此指标依据单个实例上的数据包数量标识传出流量的量。此指标仅对基本监控可用。

单位:计数

统计数据:Minimum、Maximum、Average

AWS/EC2 命名空间包括以下状态检查指标。默认情况下,状态检查指标可在 1 分钟的频率下免费提供。对于新启动的实例,状态检查指标数据仅在实例完成初始化状态之后 (实例进入运行状态的几分钟之内) 提供。有关 EC2 状态检查的更多信息,请参阅实例的状态检查

指标 描述

StatusCheckFailed

报告实例在上一分钟是否通过了实例状态检查和系统状态检查。

此指标可以是 0 (通过) 或 1 (失败)。

默认情况下,此指标可在 1 分钟的频率下免费提供。

单位:计数

StatusCheckFailed_Instance

报告实例在上个 1 分钟内是否通过了 实例状况检查。

此指标可以是 0 (通过) 或 1 (失败)。

单位:计数

StatusCheckFailed_System

报告实例在上一分钟内是否通过了 系统状况检查。

此指标可以是 0 (通过) 或 1 (失败)。

单位:计数

新 EC2 实例的 Amazon CloudWatch 数据通常在查询中请求的第一个时间段(聚合期)结束后的 1 分钟内便可使用。可以使用 Period 参数设置周期 — — 即用于聚合统计数据的时间段。有关时间段的更多信息,请参阅 时间段

可以对 EC2 实例使用当前可用的维度(例如 ImageIdInstanceType)来细化返回的指标。有关可以用于 EC2 的维度的信息,请参阅 Amazon EC2 指标的维度

AWS/EC2 命名空间包含 C5 和 M5 实例的以下 Amazon EBS 指标。

指标 说明

EBSReadOps

在指定时间段内在挂载到实例的所有 Amazon EBS 卷中完成的读取操作数。

要计算该时间段的平均每秒读取 I/O 操作数 (读取 IOPS),请将该时间段的总操作数除以秒数。如果使用基本 (5 分钟) 监控,您可以将该数字除以 300 以计算读取 IOPS。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:计数

EBSWriteOps

在指定时间段内在附加到实例的所有 EBS 卷中完成的写入操作数。

要计算该时间段的平均每秒写入 I/O 操作数 (写入 IOPS),请将该时间段的总操作数除以秒数。如果使用基本 (5 分钟) 监控,您可以将该数字除以 300 以计算写入 IOPS。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:计数

EBSReadBytes

在指定时间段内从附加到实例的所有 EBS 卷中读取的字节数。

报告的数字是在该时间段内读取的字节数。如果使用基本 (5 分钟) 监控,您可以将该数字除以 300 以计算每秒读取的字节数。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

EBSWriteBytes

在指定时间段内写入附加到实例的所有 EBS 卷的字节数。

报告的数字是在该时间段内写入的字节数。如果使用基本 (5 分钟) 监控,您可以将该数字除以 300 以计算每秒写入的字节数。如果您使用的是详细 (1 分钟) 监控,请将其除以 60。

单位:字节

EBSIOBalance%

仅适用于小型 C5 和 M5 实例大小。提供有关突增存储桶中剩余的 I/O 积分百分比的信息。此指标仅对基本监控可用。

Sum 统计数据不适用于该指标。

单位:百分比

EBSByteBalance%

仅适用于小型 C5 和 M5 实例大小。提供有关突增存储桶中剩余的吞吐量积分百分比的信息。此指标仅对基本监控可用。

Sum 统计数据不适用于该指标。

单位:百分比

Amazon EC2 指标的维度

如果使用详细监控,可以使用下表中的任意维度筛选 EC2 实例数据。

维度 说明
AutoScalingGroupName

该维度筛选您为指定容量组中的所有实例请求的数据。如果您使用 Auto Scaling,Auto Scaling 组就是您定义的实例集合。当实例在上述 Auto Scaling 组中时,该维度仅供 Amazon EC2 指标使用。可供启用了详细或基本监控的实例使用。

ImageId

该维度筛选您为运行此 Amazon EC2 Amazon 系统映像 (AMI) 的所有实例而请求的数据。可供启用了详细监控功能的实例使用。

InstanceId

该维度筛选您仅为已识别实例请求的数据。这样有助于您精确定位要对其监控数据的确切实例。

InstanceType

该维度筛选您为以这一指定实例类型运行的所有实例请求的数据。这样有助于您按运行的实例类型给数据分类。例如,您可以比较 m1.small 实例和 m1.large 实例的数据,以确定哪一个对您的应用程序具有更好的商业价值。可供启用了详细监控功能的实例使用。