Amazon CloudWatch
用户指南
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

Elastic Load Balancing 指标和维度

Elastic Load Balancing 支持两类负载均衡器:传统负载均衡器和应用程序负载均衡器。Elastic Load Balancing 将向 CloudWatch 发送这两类负载均衡器的指标。

应用程序负载均衡器 指标

AWS/ApplicationELB 命名空间包括以下指标。

指标 描述
ActiveConnectionCount

从客户端到负载均衡器以及从负载均衡器到目标的并发活动 TCP 连接的总数。

Statistics:最有用的统计工具是 Sum

ClientTLSNegotiationErrorCount

由未与负载均衡器建立会话的客户端发起的 TLS 连接数。可能的原因包括密码或协议不匹配。

Statistics:最有用的统计工具是 Sum

ConsumedLCUs

负载均衡器使用的负载均衡器容量单位 (LCU) 数量。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 LCU 详情

HealthyHostCount

被视为正常运行的目标数量。

Statistics:最有用的统计工具是 AverageMinimumMaximum

HTTPCode_ELB_4XX_Count

源自负载均衡器的 HTTP 4XX 客户端错误代码的数量。如果请求格式错误或不完整,则会生成客户端错误。目标尚未收到这些请求。该计数不包含目标生成的任何响应代码。

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

HTTPCode_ELB_5XX_Count

源自负载均衡器的 HTTP 5XX 服务器错误代码的数量。该计数不包含目标生成的任何响应代码。

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

HTTPCode_Target_2XX_CountHTTPCode_Target_3XX_CountHTTPCode_Target_4XX_CountHTTPCode_Target_5XX_Count

目标生成的 HTTP 响应代码的数量。它不包括负载均衡器生成的任何响应代码。

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

IPv6ProcessedBytes

负载均衡器通过 IPv6 处理的总字节数。

Statistics:最有用的统计工具是 Sum

IPv6RequestCount

负载均衡器收到的 IPv6 请求的数量。

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

NewConnectionCount

从客户端到负载均衡器以及从负载均衡器到目标建立的新 TCP 连接的总数。

Statistics:最有用的统计工具是 Sum

ProcessedBytes

负载均衡器通过 IPv4 和 IPv6 处理的总字节数。

Statistics:最有用的统计工具是 Sum

RejectedConnectionCount

由于负载均衡器达到连接数上限被拒绝的链接的数量。

Statistics:最有用的统计工具是 Sum

RequestCount

负载均衡器收到的请求数量。这包括通过 IPv4 和 IPv6 的请求。

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

RequestCountPerTarget

目标组中每个目标收到的平均请求数量。您必须使用 TargetGroup 维度指定目标组。

统计:唯一有效的统计数据是 Sum。请注意,这代表平均值,而不是总和。

RuleEvaluations

在给定 1 小时的平均请求速率的情况下,负载均衡器处理的规则的数量。

Statistics:最有用的统计工具是 Sum

TargetConnectionErrorCount

负载均衡器和目标之间连接建立不成功的次数。

Statistics:最有用的统计工具是 Sum

TargetResponseTime

请求离开负载均衡器直至收到来自目标的响应所用的时间(以秒为单位)。这与访问日志中的 target_processing_time 字段是等效的。

Statistics:最有用的统计工具是 AveragepNN.NN(百分比)。

TargetTLSNegotiationErrorCount

由未与目标建立会话的负载均衡器发起的 TLS 连接数。可能的原因包括密码或协议不匹配。

Statistics:最有用的统计工具是 Sum

UnHealthyHostCount

被视为未正常运行的目标数量。

Statistics:最有用的统计工具是 AverageMinimumMaximum

应用程序负载均衡器 的指标维度

要筛选您的应用程序负载均衡器的指标,可以使用以下维度。

维度 描述
AvailabilityZone

按照可用区筛选指标数据。

LoadBalancer

按负载均衡器筛选指标数据。按以下方式指定负载均衡器:app/load-balancer-name/1234567890123456(负载均衡器 ARN 的结尾部分)。

TargetGroup

按目标组筛选指标数据。按以下方式指定目标组:targetgroup/target-group-name/1234567890123456(目标组 ARN 的结尾部分)。

网络负载均衡器指标

AWS/NetworkELB 命名空间包括以下指标。

指标 描述
ActiveFlowCount

客户端至目标的并发 TCP 流 (或连接) 的总数。此指标仅包含处于 ESTABLISHED 状态的连接。TCP 连接未在负载均衡器上终止,因此,一个开放与目标的 TCP 连接的客户端将计为一个流。

Statistics:最有用的统计工具是 AverageMaximumMinimum

HealthyHostCount

被视为正常运行的目标数量。

Statistics:最有用的统计工具是 AverageMaximumMinimum

NewFlowCount

时段内建立的客户端至目标的新 TCP 流 (或连接) 的总数。

Statistics:最有用的统计工具是 Sum

ProcessedBytes

负载均衡器处理的字节总数,包括 TCP/IP 标头。

Statistics:最有用的统计工具是 Sum

TCP_Client_Reset_Count

从客户端发送至目标的重置 (RST) 数据包的总数。这些重置由客户端生成,然后由负载均衡器转发。

Statistics:最有用的统计工具是 Sum

TCP_ELB_Reset_Count

负载均衡器生成的重置 (RST) 数据包的总数。

Statistics:最有用的统计工具是 Sum

TCP_Target_Reset_Count

从目标发送至客户端的重置 (RST) 数据包的总数。这些重置由目标生成,然后由负载均衡器转发。

Statistics:最有用的统计工具是 Sum

UnHealthyHostCount

被视为未正常运行的目标数量。

Statistics:最有用的统计工具是 AverageMaximumMinimum

网络负载均衡器的指标维度

要筛选负载均衡器的指标,请使用以下维度。

维度 描述
AvailabilityZone

按照可用区筛选指标数据。

LoadBalancer

按负载均衡器筛选指标数据。按以下方式指定负载均衡器:net/load-balancer-name/1234567890123456 (负载均衡器 ARN 的结尾部分)。

TargetGroup

按目标组筛选指标数据。按以下方式指定目标组:targetgroup/target-group-name/1234567890123456(目标组 ARN 的结尾部分)。

传统负载均衡器 指标

AWS/ELB 命名空间包括以下指标。

指标 描述
BackendConnectionErrors

负载均衡器和注册实例之间连接建立不成功的次数。因为负载均衡器在发生错误时会重试连接,所以此计数会超过请求速率。请注意,此计数还包含与运行状况检查有关的所有连接错误。

报告标准:有非零值。

Statistics:最有用的统计工具是 Sum。请注意,AverageMinimumMaximum 针对每个负载均衡器节点报告,一般并无用处。然而,最小值与最大值(或者峰值到平均值、平均值到谷底)之间的差异可用于确定负载均衡器节点是否存在异常。

示例:假设您的负载均衡器在 us-west-2a 和 us-west-2b 各有 2 个实例,并且向 us-west-2a 中 1 个实例的连接尝试导致出现后端连接错误。us-west-2a 的 sum 值包含这些连接错误,而 us-west-2b 的 sum 值不包含。因此,负载均衡器的 sum 值等于 us-west-2a 的 sum 值。

HealthyHostCount

向负载均衡器注册的运行状况良好的实例的数量。新注册的实例在通过第一次运行状况检查后被视为运行状况良好。如果启用跨可用区负载均衡,则会跨所有可用区为 LoadBalancerName 维度计算运行状况良好的实例的数量。否则,将为每个可用区域计算该数量。

报告标准:有注册的实例

Statistics:最有用的统计工具为 AverageMaximum。这些统计数据由负载均衡器节点决定。请注意,某些负载均衡器节点可能在短时间内认为某实例运行状况不佳,而其他节点将该实例视为运行状况良好。

示例:假设您的负载均衡器在 us-west-2a 和 us-west-2b 各有 2 个实例,并且 us-west-2a 的 1 个实例运行状况不佳,而 us-west-2b 没有运行状况不佳的实例。对于 AvailabilityZone 维度,us-west-2a 平均有 1 个运行状况良好和 1 个运行状况不佳的实例,us-west-2b 平均有 2 个运行状况良好和 0 个运行状况不佳的实例。

HTTPCode_Backend_2XXHTTPCode_Backend_3XXHTTPCode_Backend_4XXHTTPCode_Backend_5XX

[HTTP 侦听器] 注册实例生成的 HTTP 响应代码的数量。该计数不包含负载均衡器生成的任何响应代码。

报告标准:有非零值

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均为 1。

示例:假设您的负载均衡器在 us-west-2a 和 us-west-2b 各有 2 个实例,并且发送到 us-west-2a 中的 1 个实例的请求导致了 HTTP 500 响应。us-west-2a 的 sum 值包含这些错误响应,而 us-west-2b 的 sum 值不包含。因此,负载均衡器的 sum 值等于 us-west-2a 的 sum 值。

HTTPCode_ELB_4XX

[HTTP 侦听器] 负载均衡器生成的 HTTP 4XX 客户端错误代码的数量。如果请求格式错误或不完整,则会生成客户端错误。

报告标准:有非零值

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均为 1。

示例:假设您的负载均衡器启用了 us-west-2a 和 us-west-2b,并且客户端请求包含格式错误的请求 URL。结果可能导致所有可用区中客户端错误增加。负载均衡器的 sum 值为各可用区的值的总和。

HTTPCode_ELB_5XX

[HTTP 侦听器] 负载均衡器生成的 HTTP 5XX 服务器错误代码的数量。此计数不包括注册实例生成的任何响应代码。如果没有运行状况良好的实例注册到负载均衡器,或者请求速率超过实例或负载均衡器的容量(溢出),则会报告该指标。

报告标准:有非零值

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均为 1。

示例:假设您的负载均衡器启用了 us-west-2a 和 us-west-2b,并且 us-west-2a 中的实例具有较高的延迟,对请求的响应较慢。结果,us-west-2a 中的负载均衡器节点波动队列填满,客户端收到 503 错误。如果 us-west-2b 继续正常响应,则负载均衡器的 sum 值将等于 us-west-2a 的 sum 值。

Latency

[HTTP 侦听器] 从负载均衡器将请求发送到已注册实例到该实例开始发送响应标头所用的总时间 (以秒为单位)。

[TCP 侦听器] 负载均衡器成功与注册实例建立连接所用的总时间 (以秒为单位)。

报告标准:有非零值

Statistics:最有用的统计工具是 AverageMaximum 可用于确定某些请求的耗时是否大大超过平均时间。请注意,Minimum 一般没什么用处。

示例:假设您的负载均衡器在 us-west-2a 和 us-west-2b 各有 2 个实例,并且发送到 us-west-2a 中的 1 个实例的请求具有较高的延迟。us-west-2a 的 average 值将高于 us-west-2b 的 average 值。

RequestCount

在指定的时间段(1 或 5 分钟)完成的请求或者发出的连接的数量。

[HTTP 侦听器] 收到和路由的请求数,包括来自注册实例的 HTTP 错误响应。

[TCP 侦听器] 向注册实例发出的连接的数量。

报告标准:有非零值

Statistics:最有用的统计工具是 Sum。请注意,MinimumMaximumAverage 均返回 1。

示例:假设您的负载均衡器在 us-west-2a 和 us-west-2b 各有 2 个实例,并有 100 个请求发送至该负载均衡器。有 60 个请求发送至 us-west-2a,每个实例接收 30 个请求,有 40 个请求发送至 us-west-2b,每个实例接收 20 个请求。对于 AvailabilityZone 维度,us-west-2a 总计有 60 个请求,us-west-2b 总计有 40 个请求。对于 LoadBalancerName 维度,总计有 100 个请求。

SpilloverCount

因波动队列填满而拒绝的请求的总数。

[HTTP 侦听器] 负载均衡器返回 HTTP 503 错误代码。

[TCP 侦听器] 负载均衡器关闭连接。

报告标准:有非零值

Statistics:最有用的统计工具是 Sum。请注意,AverageMinimumMaximum 针对每个负载均衡器节点报告,一般并无用处。

示例:假设您的负载均衡器启用了 us-west-2a 和 us-west-2b,并且 us-west-2a 中的实例具有较高的延迟,对请求的响应较慢。结果是 us-west-2a 中的负载均衡器节点波动队列填满,导致溢出。如果 us-west-2b 继续正常响应,则负载均衡器的 sum 值将与 us-west-2a 的 sum 值相同。

SurgeQueueLength

等待路由的请求的总数。如果负载均衡器无法连接运行状况良好的实例以路由某个请求,则会将该请求排队。队列的最大大小为 1024。队列填满后,额外的请求将被拒绝。有关更多信息,请参阅 SpilloverCount

报告标准:有非零值。

统计数据:最有价值的统计数据是 Maximum,因为它代表排队请求的峰值。结合使用 Average 统计数据与 MinimumMaximum 可以确定排队请求的范围。请注意,Sum 并无用处。

示例:假设您的负载均衡器启用了 us-west-2a 和 us-west-2b,并且 us-west-2a 中的实例具有较高的延迟,对请求的响应较慢。结果是 us-west-2a 中的负载均衡器节点波动队列填满,很可能导致客户端的响应时间增加。如果这种情况继续存在,负载均衡器可能溢出(参阅 SpilloverCount 指标)。如果 us-west-2b 继续正常响应,则负载均衡器的 max 将与 us-west-2a 的 max 相同。

UnHealthyHostCount

向负载均衡器注册的运行状况不良的实例的数量。如果实例超过运行状况检查所配置的不佳阈值,则认为实例运行状况不佳。不佳实例在符合运行状况检查所配置的良好阈值之后,被重新视为运行状况良好。

报告标准:有注册的实例

Statistics:最有用的统计工具为 AverageMinimum。这些统计数据由负载均衡器节点决定。请注意,某些负载均衡器节点可能在短时间内认为某实例运行状况不佳,而其他节点将该实例视为运行状况良好。

示例:请参阅HealthyHostCount

以下指标可供您估算将 传统负载均衡器 迁移到 应用程序负载均衡器 的成本。这些指标仅供参考,不适用于 CloudWatch 警报。注意,如果您的 传统负载均衡器 有多个侦听器,则这些指标在所有侦听器上进行聚合。

估算值基于包含一条默认规则和一个大小为 2K 的证书的负载均衡器。如果您使用的是大小为 4K 或以上的证书,我们建议您按如下方式估算成本:使用迁移工具基于您的 传统负载均衡器 创建一个 应用程序负载均衡器,然后监控该 应用程序负载均衡器 的 ConsumedLCUs 指标。有关更多信息,请参阅 Elastic Load Balancing 用户指南 中的从 传统负载均衡器 迁移到 应用程序负载均衡器

指标 描述
EstimatedALBActiveConnectionCount

从客户端到负载均衡器以及从负载均衡器到目标的并发活动 TCP 连接的估计数。

EstimatedALBConsumedLCUs

应用程序负载均衡器 使用的负载均衡器容量单位 (LCU) 的估计数。您需要为每小时使用的 LCU 数量付费。有关更多信息,请参阅 LCU 详情

EstimatedALBNewConnectionCount

从客户端到负载均衡器以及从负载均衡器到目标建立的新 TCP 连接的估计数。

EstimatedProcessedBytes

应用程序负载均衡器处理的估计字节数。

传统负载均衡器 的指标维度

要筛选您的 传统负载均衡器 的指标,可以使用以下维度。

维度 描述
AvailabilityZone

按指定的可用区筛选指标数据。

LoadBalancerName

按指定的负载均衡器筛选指标数据。