CloudWatch 代理收集的 Prometheus 指标 - Amazon CloudWatch
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

CloudWatch 代理收集的 Prometheus 指标

具有 Prometheus 支持的 CloudWatch 代理可自动从多个服务和工作负载收集指标。以下部分列出了默认情况下收集的指标。您还可以将 代理配置为从这些服务中收集更多指标,并从其他应用程序和服务中收集 Prometheus 指标。有关收集其他指标的更多信息,请参阅 CloudWatchPrometheus 的 代理配置

从 Amazon EKS 和 Kubernetes 集群中收集的 Prometheus 指标位于 ContainerInsights 命名空间中。从 Amazon ECS 集群收集的 Prometheus 指标位于 ContainerInsights 命名空间中。

App Mesh 的 Prometheus 指标

从 中自动收集以下指标App Mesh。

CloudWatch Container Insights 还可以收集 App Mesh Envoy 访问日志。有关更多信息,请参阅(可选)启用 App Mesh Envoy 访问日志

App Mesh 和 Kubernetes 集群Amazon EKS上 的 Prometheus 指标

指标名称 Dimensions

envoy_http_downstream_rq_total

ClusterName,Namespace

envoy_http_downstream_rq_xx

ClusterName,Namespace

ClusterName,Namespace,envoy_http_conn_manager_prefix,envoy_response_code_class

envoy_cluster_upstream_cx_rx_bytes_total

ClusterName,Namespace

envoy_cluster_upstream_cx_tx_bytes_total

ClusterName,Namespace

envoy_cluster_membership_healthy

ClusterName,Namespace

envoy_cluster_membership_total

ClusterName,Namespace

envoy_server_memory_heap_size

ClusterName,Namespace

envoy_server_memory_allocated

ClusterName,Namespace

envoy_cluster_upstream_cx_connect_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_pending_failure_eject

ClusterName,Namespace

envoy_cluster_upstream_rq_pending_overflow

ClusterName,Namespace

envoy_cluster_upstream_rq_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_try_per_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_rx_reset

ClusterName,Namespace

envoy_cluster_upstream_cx_destroy_local_with_active_rq

ClusterName,Namespace

envoy_cluster_upstream_cx_destroy_remote_active_rq

ClusterName,Namespace

envoy_cluster_upstream_rq_maintenance_mode

ClusterName,Namespace

envoy_cluster_upstream_flow_control_paused_reading_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_resumed_reading_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_backed_up_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_drained_total

ClusterName,Namespace

envoy_cluster_upstream_rq_retry

ClusterName,Namespace

envoy_cluster_upstream_rq_retry_success

ClusterName,Namespace

envoy_cluster_upstream_rq_retry_overflow

ClusterName,Namespace

envoy_server_live

ClusterName,Namespace

envoy_server_uptime

ClusterName,Namespace

App Mesh 集群Amazon ECS上 的 Prometheus 指标

指标名称 Dimensions

envoy_http_downstream_rq_total

ClusterName、TaskDefinitionFamily

envoy_http_downstream_rq_xx

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_rx_bytes_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_tx_bytes_total

ClusterName、TaskDefinitionFamily

envoy_cluster_membership_healthy

ClusterName、TaskDefinitionFamily

envoy_cluster_membership_total

ClusterName、TaskDefinitionFamily

envoy_server_memory_heap_size

ClusterName、TaskDefinitionFamily

envoy_server_memory_allocated

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_connect_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_pending_failure_eject

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_pending_overflow

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_try_per_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_rx_reset

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_destroy_local_with_active_rq

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_destroy_remote_active_rq

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_maintenance_mode

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_paused_reading_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_resumed_reading_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_backed_up_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_drained_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry_success

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry_overflow

ClusterName、TaskDefinitionFamily

envoy_server_live

ClusterName、TaskDefinitionFamily

envoy_server_uptime

ClusterName、TaskDefinitionFamily

envoy_http_downstream_rq_xx

ClusterName、TaskDefinitionFamily、envoy_http_conn_manager_prefix、envoy_response_code_class

ClusterName、TaskDefinitionFamily、envoy_response_code_class

注意

TaskDefinitionFamily 是网格的 Kubernetes 命名空间。

的值envoy_http_conn_manager_prefix可以是 ingressegressadmin

的值envoy_response_code_class可以是 1 ( 表示 1xx)、 2 表示 2xx 3)、 3xx 表示 4)、 表示 4xx) 或 5 表示 5xx)。

NGINX 的 Prometheus 指标

从 Amazon EKS 和 Kubernetes 集群上的 NGINX 自动收集以下指标。

指标名称 Dimensions

nginx_ingress_controller_nginx_process_cpu_seconds_total

ClusterName,Namespace,Service

nginx_ingress_controller_success

ClusterName,Namespace,Service

nginx_ingress_controller_requests

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_connections

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_connections_total

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_resident_memory_bytes

ClusterName,Namespace,Service

nginx_ingress_controller_config_last_reload_successful

ClusterName,Namespace,Service

nginx_ingress_controller_requests

ClusterName,Namespace,Service,status

memcached 的 Prometheus 指标

从 Amazon EKS 和 Kubernetes 集群上的 memcached 中自动收集以下指标。

指标名称 Dimensions

memcached_current_items

ClusterName,Namespace,Service

memcached_current_connections

ClusterName,Namespace,Service

memcached_limit_bytes

ClusterName,Namespace,Service

memcached_current_bytes

ClusterName,Namespace,Service

memcached_written_bytes_total

ClusterName,Namespace,Service

memcached_read_bytes_total

ClusterName,Namespace,Service

memcached_items_evicted_total

ClusterName,Namespace,Service

memcached_items_reclaimed_total

ClusterName,Namespace,Service

memcached_commands_total

ClusterName,Namespace,Service

ClusterName,Namespace,Service,command

ClusterName,Namespace,Service,status,command

Java/JMX 的 Prometheus 指标

在 Amazon EKS 和 Kubernetes 集群上收集的指标

在 Amazon EKS 和 Kubernetes 集群上,Container Insights 可以使用 JMX Exporter 从 Java 虚拟机 (JVM)、Java 和 Tomcat (Catalina) 中收集以下预定义的 Prometheus 指标。有关更多信息,请参阅 Github 上的 prometheus/jmx_exporter

Amazon EKS 和 Kubernetes 集群上的 Java/JMX

指标名称 Dimensions

jvm_classes_loaded

ClusterName,Namespace

jvm_threads_current

ClusterName,Namespace

jvm_threads_daemon

ClusterName,Namespace

java_lang_operatingsystem_totalswapspacesize

ClusterName,Namespace

java_lang_operatingsystem_systemcpuload

ClusterName,Namespace

java_lang_operatingsystem_processcpuload

ClusterName,Namespace

java_lang_operatingsystem_freeswapspacesize

ClusterName,Namespace

java_lang_operatingsystem_totalphysicalmemorysize

ClusterName,Namespace

java_lang_operatingsystem_freephysicalmemorysize

ClusterName,Namespace

java_lang_operatingsystem_openfiledescriptorcount

ClusterName,Namespace

java_lang_operatingsystem_availableprocessors

ClusterName,Namespace

jvm_memory_bytes_used

ClusterName,Namespace,area

jvm_memory_pool_bytes_used

ClusterName,Namespace,pool

注意

area 维度的值可以是 heapnonheap

pool 维度的值可以是 Tenured GenCompress Class SpaceSurvivor SpaceEden SpaceCode CacheMetaspace

Amazon EKS 和 Kubernetes 集群上的 Tomcat/JMX

除了上表中的 Java/JMX 指标外,还收集 Tomcat 工作负载的以下指标。

指标名称 Dimensions

catalina_manager_activesessions

ClusterName,Namespace

catalina_manager_rejectedsessions

ClusterName,Namespace

catalina_globalrequestprocessor_bytesreceived

ClusterName,Namespace

catalina_globalrequestprocessor_bytessent

ClusterName,Namespace

catalina_globalrequestprocessor_requestcount

ClusterName,Namespace

catalina_globalrequestprocessor_errorcount

ClusterName,Namespace

catalina_globalrequestprocessor_processingtime

ClusterName,Namespace

Amazon ECS 集群上的 Java/JMX

指标名称 Dimensions

jvm_classes_loaded

ClusterName、TaskDefinitionFamily

jvm_threads_current

ClusterName、TaskDefinitionFamily

jvm_threads_daemon

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_totalswapspacesize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_systemcpuload

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_processcpuload

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_freeswapspacesize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_totalphysicalmemorysize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_freephysicalmemorysize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_openfiledescriptorcount

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_availableprocessors

ClusterName、TaskDefinitionFamily

jvm_memory_bytes_used

ClusterName、TaskDefinitionFamily、Area

jvm_memory_pool_bytes_used

ClusterName,TaskDefinitionFamily,池

注意

area 维度的值可以是 heapnonheap

pool 维度的值可以是 Tenured GenCompress Class SpaceSurvivor SpaceEden SpaceCode CacheMetaspace

Amazon ECS 集群上的 Tomcat/JMX

除了上表中的 Java/JMX 指标之外,还为 Amazon ECS 集群上的 Tomcat 工作负载收集了以下指标。

指标名称 Dimensions

catalina_manager_activesessions

ClusterName、TaskDefinitionFamily

catalina_manager_rejectedsessions

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_bytesreceived

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_bytessent

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_requestcount

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_errorcount

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_processingtime

ClusterName、TaskDefinitionFamily

HAProxy 的 Prometheus 指标

从 Amazon EKS 和 Kubernetes 集群上的 HAProxy 自动收集以下指标。

收集的指标取决于您使用的 HAProxy 入口版本。有关 HAProxy 入口及其版本的更多信息,请参阅 haproxy-ingress。

指标名称 Dimensions 可用性

haproxy_backend_bytes_in_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_backend_bytes_out_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_backend_connection_errors_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_backend_connections_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_backend_current_sessions

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_backend_http_responses_total

ClusterName,Namespace,Service,code,backend

HAProxy 入口的所有版本

haproxy_backend_status

ClusterName,Namespace,Service

仅在 HAProxy 入口的版本 0.10 或更高版本中

haproxy_backend_up

ClusterName,Namespace,Service

仅在 HAProxy Ingress 的版本 0.10 之前

haproxy_frontend_bytes_in_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_bytes_out_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_connections_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_current_sessions

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_http_requests_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_http_responses_total

ClusterName,Namespace,Service,code,frontend

HAProxy 入口的所有版本

haproxy_frontend_request_errors_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

haproxy_frontend_requests_denied_total

ClusterName,Namespace,Service

HAProxy 入口的所有版本

注意

code 维度的值可以是 1xx2xx3xx4xx5xxother

backend 维度的值可以是:

  • http-default-backendhttp-shared-backendhttpsback-shared-backend (对于 HAProxy Ingress 版本 0.0.27 或更早版本)。

  • _default_backend 适用于高于 0.0.27 的 HAProxy 入口版本。

frontend 维度的值可以是:

  • httpfront-default-backendhttpfront-shared-frontendhttpfronts (对于 HAProxy Ingress 版本 0.0.27 或更早版本)。

  • _front_http_front_https (对于高于 0.0.27 的 HAProxy 入口版本)。