使用 CloudWatch 指标进行监控 - Amazon CloudWatch 日志
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 CloudWatch 指标进行监控

CloudWatch 日志 CloudWatch 每分钟向 Amazon 发送一次指标。

CloudWatch 记录指标

AWS/Logs 命名空间包括以下指标。

指标 描述

CallCount

在您账户中执行的指定 API 操作的数量。

CallCount是一项 CloudWatch 日志服务使用量指标。有关更多信息,请参阅 CloudWatch 记录服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

DeliveryErrors

在将数据转发到订阅目标时,Lo CloudWatch gs 收到错误的日志事件的数量。如果目标服务返回可重试的错误,例如限制异常或可重试的服务异常(例如 HTTP 5xx),则 CloudWatch 日志会继续重试传送长达 24 小时。 CloudWatch 如果错误是不可重试的错误(例如或),则日志不会尝试重新传送。AccessDeniedException ResourceNotFoundException

有效尺寸: LogGroupName、 DestinationType、 FilterName、 PolicyLevel

有效统计数据:Sum

单位:无

DeliveryThrottling

将数据转发到订阅目标时,限制 CloudWatch 日志的日志事件数量。

如果目标服务返回可重试的错误,例如限制异常或可重试的服务异常(例如 HTTP 5xx),则 CloudWatch 日志会继续重试传送长达 24 小时。 CloudWatch 如果错误是不可重试的错误(例如或),则日志不会尝试重新传送。AccessDeniedException ResourceNotFoundException

有效尺寸: LogGroupName、 DestinationType、 FilterName、 PolicyLevel

有效统计数据:Sum

单位:无

EMFParsingErrors

处理嵌入式指标格式日志时遇到的解析错误数量。当日志被识别为嵌入式指标格式但不遵循正确的格式时,就会发生此类错误。有关嵌入式指标格式的更多信息,请参阅规范:嵌入式指标格式

有效维度:LogGroupName

有效统计数据:Sum

单位:无

EMFValidationErrors

处理嵌入式指标格式日志时遇到的验证错误数量。当嵌入式指标格式日志中的指标定义不遵循嵌入式指标格式和 MetricDatum 规范时,就会出现这些错误。有关 CloudWatch 嵌入式指标格式的信息,请参阅规范:嵌入式指标格式。有关数据类型的信息MetricDatum,请参阅 Amazon CloudWatch API 参考MetricDatum中的。

注意

某些验证错误可能导致 EMF 日志中的多个指标未发布。例如,所有使用无效命名空间设置的指标均将被删除。

有效维度:LogGroupName

有效统计数据:Sum

单位:无

ErrorCount

在您账户中执行的导致了错误的 API 操作的数量。

ErrorCount是一项 CloudWatch 日志服务使用量指标。有关更多信息,请参阅 CloudWatch 记录服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

ForwardedBytes

以压缩字节转发到订阅目标的日志事件的容量。

有效尺寸: LogGroupName、 DestinationType、 FilterName

有效统计数据:Sum

单位:字节

ForwardedLogEvents

转发到订阅目标的日志事件的数量。

有效尺寸: LogGroupName、 DestinationType、 FilterName、 PolicyLevel

有效统计数据:Sum

单位:无

IncomingBytes

上传到日志的日志事件量(以未压缩字节为 CloudWatch 单位)。当用于 LogGroupName 维度时,这是以未压缩字节上传到日志组的日志事件的容量。

有效尺寸: LogGroupName

有效统计数据:Sum

单位:字节

IncomingLogEvents

上传到 CloudWatch 日志的日志事件数量。当用于 LogGroupName 维度时,这是上传到日志组的日志事件的数量。

有效尺寸: LogGroupName

有效统计数据:Sum

单位:无

LogEventsWithFindings

与您正在使用日志数据保护功能审核的数据字符串相匹配的 CloudWatch 日志事件数量。有关更多信息,请参阅 通过屏蔽帮助保护敏感的日志数据

有效维度:无

有效统计数据:Sum

单位:无

ThrottleCount

因使用量配额而被限制在您账户中执行的 API 操作数量。

ThrottleCount是一项 CloudWatch 日志服务使用量指标。有关更多信息,请参阅 CloudWatch 记录服务使用情况指标

有效维度:类、资源、服务、类型

有效统计数据:Sum

单位:无

CloudWatch 日志指标的维度

下表列出了可用于 CloudWatch 日志指标的维度。

维度 描述
LogGroupName

要显示其指标的 CloudWatch 日志日志组的名称。

DestinationType

CloudWatch 日志数据的订阅目标,可以是 Amazon Lambda Amazon Kinesis Data Streams 或 Amazon Data Firehose。

FilterName

将数据从日志组转发到目标的订阅筛选器的名称。订阅筛选器名称会自动转换 CloudWatch 为 ASCII,任何不支持的字符都将替换为问号 (?)。

下表列出了与账户级订阅筛选条件相关的指标的维度。

维度 描述
PolicyLevel

政策适用的级别。目前,该维度的唯一有效值是 AccountPolicy

DestinationType

CloudWatch 日志数据的订阅目标,可以是 Amazon Lambda Amazon Kinesis Data Streams 或 Amazon Data Firehose。

FilterName

将数据从日志组转发到目标的订阅筛选器的名称。订阅筛选器名称会自动转换 CloudWatch 为 ASCII,任何不支持的字符都将替换为问号 (?)。

CloudWatch 记录服务使用情况指标

CloudWatch 日志向其 CloudWatch 发送跟踪使用情况的指标 CloudWatch Logs API 操作。这些指标对应于 Amazon 服务配额。跟踪这些指标可帮助您主动管理配额。有关更多信息,请参阅 Service Quotas 集成和使用量指标

例如,您可以跟踪 ThrottleCount 指标或为该指标设置警报。如果该指标的值上升,则应考虑为受到限制的 API 操作请求增加配额。有关 CloudWatch 日志服务配额的更多信息,请参阅CloudWatch 日志配额

CloudWatch 日志每分钟都会在AWS/UsageAWS/Logs命名空间中发布服务配额使用量指标。

下表列出了 Logs 发布的服务使用情况 CloudWatch 指标。这些指标没有指定的单位。指标中最实用的统计数据是 SUM,它表示以 1 分钟为间隔的总操作数。

这些指标中的每个指标都会发布,其中包含所有 ServiceClassTypeResource 维度的值。它们还与一个名为 Account Metrics 的单一维度一同发布。使用 Account Metrics 维度来查看您账户中所有 API 操作的指标总和。使用其他维度并指定 Resource 维度的 API 操作名称,以查找该特定 API 的指标。

指标

指标 描述

CallCount

在您的账户中执行的指定操作的数量。

CallCount 同时发布在 AWS/UsageAWS/Logs 命名空间中。

ErrorCount

在您账户中执行的导致了错误的 API 操作的数量。

ErrorCount 仅发布在 AWS/Logs 中。

ThrottleCount

因使用量配额而被限制在您账户中执行的 API 操作数量。

ThrottleCount 仅发布在 AWS/Logs 中。

尺寸

维度 描述

Account metrics

使用此维度获取所有 L CloudWatch ogs API 的指标总和。

如果要查看一个特定 API 的指标,请使用此表中列出的其他维度,并将该 API 名称指定为 Resource 的值。

Service

包含资源的 Amazon 服务的名称。对于 CloudWatch 日志使用量指标,此维度的值为Logs

Class

正在跟踪的资源类别。 CloudWatch 日志 API 使用情况指标使用此维度,其值为None

Type

所跟踪的资源的类型。目前,当 Service 维度为 Logs 时,Type 的唯一有效值为 API

Resource

API 操作的名称。有效值包括操作中列出的所有 API 操作名称。例如 PutLogEvents