Amazon CloudWatch
用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

由 AWS SDK Metrics 收集的旨在提供企业级支持的指标和数据

SDK Metrics 从您的应用程序中收集数据,并使用它来向 CloudWatch 发送指标。下表列出了 SDK Metrics 收集的数据。

Data Type

消息版本

字符串

消息 ID

字符串

服务终端节点

字符串

标准化服务 ID

字符串

API 操作名称

字符串

可用性(从 SDK 客户的观点)

用于样本数的整数(0 或 1)

延迟(从 SDK 客户的观点)

分配

SDK 版本

字符串

客户端语言运行时版本

字符串

客户端操作系统

字符串

服务响应代码

键/值对

客户端语言运行时版本

字符串

示例请求 ID

List

重试

分配

限制的请求

分配

AccountID

字符串

可用区域

字符串

实例 ID

字符串

运行时环境 (Lambda/ECS)

字符串

网络错误消息

字符串/映射

源 IP 地址

字符串

目标 IP 地址

字符串

下表列出了企业级支持客户可以使用面向企业级支持的 AWS SDK Metrics 收集的指标。这些指标位于 AWS/SDKMetrics 命名空间中。

AWS Support 资源和您的技术客户经理应该有权访问 SDK Metrics 数据,以帮助您解决案例。如果您发现数据混乱或出乎意料但对应用程序性能不产生负面影响,我们建议您等待,并在计划的业务审核期间与技术客户经理一起审核该数据。

指标 说明

CallCount

从您的代码向 AWS 服务进行的成功或失败的 API 调用总数。使用 CallCount 作为基准来关联其他指标(如 ServerErrorCountThrottleCount)。

单位:计数

ClientErrorCount

失败且出现客户端错误(4xx HTTP 响应代码)的 API 调用数量。这些错误可能包括限制错误、访问被拒绝S3 存储桶不存在参数值无效。此指标的值较大通常表明您的应用程序中有内容需要修复,除非高值是由 AWS 服务限制所导致的限制的结果。在这种情况下,您应提高您的服务限制。

单位:计数

EndToEndLatency

应用程序使用 AWS 开发工具包进行调用(含重试)的总时间。

使用 EndToEndLatency 确定 AWS API 调用对应用程序总体延迟的贡献方式。延迟高于预期可能是由您的网络、防火墙或其他配置设置问题导致的。延迟也可能由开发工具包重试导致。

单位:毫秒

ConnectionErrorCount

由于连接到服务出错而失败的 API 调用数量。这些可能由应用程序与 AWS 服务之间的网络问题所导致,包括负载均衡器问题、DNS 故障以及中转提供商问题。在某些情况下,AWS 问题可能导致此错误。

使用此指标可确定问题是特定于您的应用程序,还是由基础设施或网络所导致。值较高可能也指示 API 调用的超时值较短。

单位:计数

ServerErrorCount

由于来自 AWS 服务的服务器错误(5xx HTTP 响应代码)而失败的 API 调用数量。这些错误通常由 AWS 服务所导致。

使用此指标可确定开发工具包重试或延迟的原因。此指标并不总是指示 AWS 服务出现故障,因为有些 AWS 团队将延迟分类为 HTTP 503 响应。

单位:计数

ThrottleCount

由于 AWS 服务的限制而失败的 API 调用数量。

使用此指标来评估应用程序是否已达到限制,以及确定重试和应用程序延迟的原因。如果您看到较高值,请考虑在窗口之上分配调用,而不是批处理调用。

单位:计数

您可以将以下维度用于 SDK Metrics。

维度 说明

DestinationRegion

作为调用目标的 AWS 区域。

服务

应用程序所调用的 AWS 服务。