收集的标准应用程序指标
Application Signals 从其发现的服务中收集标准应用程序指标。这些指标与服务性能中最关键的方面有关:延迟、故障和错误。这些指标可以帮助您识别问题、监控性能趋势并优化资源以改善整体用户体验。
下表列出了 Application Signals 收集的指标。这些指标被发送到 ApplicationSignals
命名空间中的 CloudWatch。
指标 | 描述 |
---|---|
|
请求发出后、数据传输开始前的延迟。 单位:毫秒 |
|
HTTP 5XX 服务器端故障和 OpenTelemetry 跨度状态错误的计数。 单位:无 |
|
HTTP 4XX 客户端错误的计数。这些错误被视为不是由服务问题引起的请求错误。因此,Application Signals 控制面板上显示的 单位:无 |
Application Signals 控制面板上显示的 Availability
指标的计算公式为 (1 - Faults
/总数)*100。回复总数包括所有回复,并源自 SampleCount(Latency)
。成功响应是指没有 5XX
错误的所有响应。当 Application Signals 计算 Availability
时,4XX
响应会被视为成功响应。
收集的维度和维度组合
为每个标准应用程序指标定义了以下维度。有关维度的更多信息,请参阅 尺寸。
为服务指标和依赖项指标收集不同的维度。在 Application Signals 发现的服务中,当微服务 A 调用微服务 B 时,微服务 B 正在处理请求。在这种情况下,微服务 A 发出依赖项指标,微服务 B 发出服务指标。当客户端调用微服务 A 时,微服务 A 正在处理请求并发出服务指标。
服务指标的维度
为服务指标收集以下维度。
维度 | 描述 |
---|---|
|
服务的名称。 最大值为 255 个字符。 |
|
API 操作或其他活动的名称。 最大值为 1024 个字符。当前,仅当操作名称不超过 194 个字符时,您才能为操作设置服务级别目标。 |
|
运行服务的环境的名称。如果服务未在 Amazon EKS 上运行,则可以在 最大值为 259 个字符。 |
当您在 CloudWatch 控制台中查看这些指标时,可以使用以下维度组合进行查看:
-
[Environment, Service, Operation, [Latency, Error, Fault]]
-
[Environment, Service, [Latency, Error, Fault]]
依赖项指标的维度
为依赖项指标收集以下维度:
维度 | 描述 |
---|---|
|
服务的名称。 最大值为 255 个字符。 |
|
API 操作或其他操作的名称。 最大值为 1024 个字符。 |
|
所调用远程服务的名称。 最大值为 255 个字符。 |
|
所调用 API 操作的名称。 最大值为 1024 个字符。 |
|
运行服务的环境的名称。如果服务未在 Amazon EKS 上运行,则可以在 最大值为 259 个字符。 |
|
运行依赖项服务的环境的名称。当服务调用依赖项并且它们都在同一集群中运行时,会自动生成 最大值为 259 个字符。 |
|
远程调用所调用资源的名称。如果服务调用远程 Amazon 服务,则会自动生成 最大值为 1024 个字符。 |
|
远程调用所调用资源的类型。仅在定义 最大值为 1024 个字符。 |
当您在 CloudWatch 控制台中查看这些指标时,可以使用以下维度组合进行查看:
在 Amazon EKS 集群上运行
-
[Environment, Service, Operation, RemoteService, RemoteOperation, RemoteEnvironment, RemoteResoureIdentifier, RemoteResourceType, [Latency, Error, Fault]]
-
[Environment, Service, Operation, RemoteService, RemoteOperation, RemoteEnvironment, [Latency, Error, Fault]]
-
[Environment, Service, Operation, RemoteService, RemoteOperation, RemoteResourceIdentifier, RemoteResourceType, [Latency, Error, Fault]]
-
[Environment, Service, Operation, RemoteService, RemoteOperation, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, RemoteEnvironment, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, RemoteOperation, RemoteEnvironment, RemoteResourceIdentifier, RemoteResourceType, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, RemoteOperation, RemoteEnvironment, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, RemoteOperation, RemoteResourceIdentifier, RemoteResourceType, [Latency, Error, Fault]]
-
[Environment, Service, RemoteService, RemoteOperation, [Latency, Error, Fault]]
-
[RemoteService]
-
[RemoteService, RemoteResourceIdentifier, RemoteResourceType]