云监视代理收集的 Prometheus 指标 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

云监视代理收集的 Prometheus 指标

具有 Prometheus 支持的 CloudWatch 代理会自动从多个服务和工作负载收集指标。以下部分列出了默认情况下收集的指标。您还可以将代理配置为从这些服务收集更多指标,以及从其他应用程序和服务收集 Prometheus 指标。有关收集其他指标的更多信息,请参阅。 Prometheus 的云监视代理配置

从亚马逊 EKS 和库贝内特群集收集的 Prometheus 指标位于集装箱景观/Prometheus命名空间。从亚马逊云服务器集群收集的 Prometheus 指标位于EC/集装箱视景/普罗米修斯命名空间。

App Mesh 的 Prometheus 量度

从 App Mesh 自动收集以下指标。

CloudWatch Container Insights 还可以收集 App Mesh se 访问日志。有关更多信息,请参阅(可选)启 App Mesh Envoy 访问日志

亚马逊 EKS 和库贝内特群集上的 App Mesh 的 Prometheus 指标

指标名称 Dimensions

envoy_http_downstream_rq_total

ClusterName,Namespace

envoy_http_downstream_rq_xx

ClusterName,Namespace

ClusterName,Namespace,envoy_http_conn_manager_prefix,envoy_response_code_class

envoy_cluster_upstream_cx_rx_bytes_total

ClusterName,Namespace

envoy_cluster_upstream_cx_tx_bytes_total

ClusterName,Namespace

envoy_cluster_membership_healthy

ClusterName,Namespace

envoy_cluster_membership_total

ClusterName,Namespace

envoy_server_memory_heap_size

ClusterName,Namespace

envoy_server_memory_allocated

ClusterName,Namespace

envoy_cluster_upstream_cx_connect_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_pending_failure_eject

ClusterName,Namespace

envoy_cluster_upstream_rq_pending_overflow

ClusterName,Namespace

envoy_cluster_upstream_rq_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_try_per_timeout

ClusterName,Namespace

envoy_cluster_upstream_rq_rx_reset

ClusterName,Namespace

envoy_cluster_upstream_cx_destroy_local_with_active_rq

ClusterName,Namespace

envoy_cluster_upstream_cx_destroy_remote_active_rq

ClusterName,Namespace

envoy_cluster_upstream_rq_maintenance_mode

ClusterName,Namespace

envoy_cluster_upstream_flow_control_paused_reading_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_resumed_reading_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_backed_up_total

ClusterName,Namespace

envoy_cluster_upstream_flow_control_drained_total

ClusterName,Namespace

envoy_cluster_upstream_rq_retry

ClusterName,Namespace

envoy_cluster_upstream_rq_retry_success

ClusterName,Namespace

envoy_cluster_upstream_rq_retry_overflow

ClusterName,Namespace

envoy_server_live

ClusterName,Namespace

envoy_server_uptime

ClusterName,Namespace

亚马逊云服务器集群上的 App Mesh Prometheus 指标

指标名称 Dimensions

envoy_http_downstream_rq_total

ClusterName、TaskDefinitionFamily

envoy_http_downstream_rq_xx

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_rx_bytes_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_tx_bytes_total

ClusterName、TaskDefinitionFamily

envoy_cluster_membership_healthy

ClusterName、TaskDefinitionFamily

envoy_cluster_membership_total

ClusterName、TaskDefinitionFamily

envoy_server_memory_heap_size

ClusterName、TaskDefinitionFamily

envoy_server_memory_allocated

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_connect_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_pending_failure_eject

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_pending_overflow

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_try_per_timeout

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_rx_reset

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_destroy_local_with_active_rq

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_cx_destroy_remote_active_rq

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_maintenance_mode

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_paused_reading_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_resumed_reading_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_backed_up_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_flow_control_drained_total

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry_success

ClusterName、TaskDefinitionFamily

envoy_cluster_upstream_rq_retry_overflow

ClusterName、TaskDefinitionFamily

envoy_server_live

ClusterName、TaskDefinitionFamily

envoy_server_uptime

ClusterName、TaskDefinitionFamily

envoy_http_downstream_rq_xx

ClusterName、TaskDefinitionFamily、envoy_http_conp_manager _前缀、envoy_响应se_code_code_class

ClusterName、TaskDefinitionFamily、特使 _ 响应 _code_class

注意

TaskDefinitionFamily是网格的库贝内特命名空间。

的值envoy_http_conn_manager_prefixingressegress,或者admin

的值envoy_response_code_class1(代表1xx),2代表2xx),3代表3xx),4代表4xx),或5代表5xx)。

NGINX 的 Prometheus 指标

从 Amazon EKS 和 Kubernetes 集群上的 NGINX 自动收集以下指标。

指标名称 Dimensions

nginx_ingress_controller_nginx_process_cpu_seconds_total

ClusterName,Namespace,Service

nginx_ingress_controller_success

ClusterName,Namespace,Service

nginx_ingress_controller_requests

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_connections

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_connections_total

ClusterName,Namespace,Service

nginx_ingress_controller_nginx_process_resident_memory_bytes

ClusterName,Namespace,Service

nginx_ingress_controller_config_last_reload_successful

ClusterName,Namespace,Service

nginx_ingress_controller_requests

ClusterName,Namespace,Service,status

Memcached 的 Prometheus 指标

从 Amazon EKS 和 Kubernetes 集群上的 Memcached 中自动收集以下指标。

指标名称 Dimensions

memcached_current_items

ClusterName,Namespace,Service

memcached_current_connections

ClusterName,Namespace,Service

memcached_limit_bytes

ClusterName,Namespace,Service

memcached_current_bytes

ClusterName,Namespace,Service

memcached_written_bytes_total

ClusterName,Namespace,Service

memcached_read_bytes_total

ClusterName,Namespace,Service

memcached_items_evicted_total

ClusterName,Namespace,Service

memcached_items_reclaimed_total

ClusterName,Namespace,Service

memcached_commands_total

ClusterName,Namespace,Service

ClusterName,Namespace,Service,command

ClusterName,Namespace,Service,status,command

Java/JMX 的 Prometheus 指标

在亚马逊 EKS 和库贝内特群集上收集的指标

在 Amazon EKS 和 Kubernetes 集群上,Container Insights 可以使用 JMX Exporter 从 Java 虚拟机 (JVM)、Java 和 Tomcat (Catalina) 收集以下预定义的 Prometheus 指标。有关更多信息,请参阅 Github 上的 prometheus/jmx_exporter

亚马逊EKS 和库贝内特群集上的 JAVA/JMX

指标名称 Dimensions

jvm_classes_loaded

ClusterName,Namespace

jvm_threads_current

ClusterName,Namespace

jvm_threads_daemon

ClusterName,Namespace

java_lang_operatingsystem_totalswapspacesize

ClusterName,Namespace

java_lang_operatingsystem_systemcpuload

ClusterName,Namespace

java_lang_operatingsystem_processcpuload

ClusterName,Namespace

java_lang_operatingsystem_freeswapspacesize

ClusterName,Namespace

java_lang_operatingsystem_totalphysicalmemorysize

ClusterName,Namespace

java_lang_operatingsystem_freephysicalmemorysize

ClusterName,Namespace

java_lang_operatingsystem_openfiledescriptorcount

ClusterName,Namespace

java_lang_operatingsystem_availableprocessors

ClusterName,Namespace

jvm_memory_bytes_used

ClusterName,Namespace,area

jvm_memory_pool_bytes_used

ClusterName,Namespace,pool

注意

area 维度的值可以是 heapnonheap

pool 维度的值可以是 Tenured GenCompress Class SpaceSurvivor SpaceEden SpaceCode CacheMetaspace

亚马逊 EKS 和库贝内特集群上的 TomCat/JMX

除了上表中的 Java/JMX 指标外,还收集 Tomcat 工作负载的以下指标。

指标名称 Dimensions

catalina_manager_activesessions

ClusterName,Namespace

catalina_manager_rejectedsessions

ClusterName,Namespace

catalina_globalrequestprocessor_bytesreceived

ClusterName,Namespace

catalina_globalrequestprocessor_bytessent

ClusterName,Namespace

catalina_globalrequestprocessor_requestcount

ClusterName,Namespace

catalina_globalrequestprocessor_errorcount

ClusterName,Namespace

catalina_globalrequestprocessor_processingtime

ClusterName,Namespace

亚马逊云服务器集群上的 Java /JMX

指标名称 Dimensions

jvm_classes_loaded

ClusterName、TaskDefinitionFamily

jvm_threads_current

ClusterName、TaskDefinitionFamily

jvm_threads_daemon

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_totalswapspacesize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_systemcpuload

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_processcpuload

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_freeswapspacesize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_totalphysicalmemorysize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_freephysicalmemorysize

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_openfiledescriptorcount

ClusterName、TaskDefinitionFamily

java_lang_operatingsystem_availableprocessors

ClusterName、TaskDefinitionFamily

jvm_memory_bytes_used

ClusterName Name、NTaskDefinitionFamily Name Name Name

jvm_memory_pool_bytes_used

ClusterName Name、NamesstanceName ClusterName、Container

注意

area 维度的值可以是 heapnonheap

pool 维度的值可以是 Tenured GenCompress Class SpaceSurvivor SpaceEden SpaceCode CacheMetaspace

亚马逊云服务器集群上的 TomCat/JMX

除了上表中的 Java/JMX 指标外,还收集 Amazon ECS 集群上的 Tomcat 工作负载的以下指标。

指标名称 Dimensions

catalina_manager_activesessions

ClusterName、TaskDefinitionFamily

catalina_manager_rejectedsessions

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_bytesreceived

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_bytessent

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_requestcount

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_errorcount

ClusterName、TaskDefinitionFamily

catalina_globalrequestprocessor_processingtime

ClusterName、TaskDefinitionFamily

HAProxy 的 Prometheus 指标

从亚马逊 EKS 和 Kubernetes 集群的 HAProxy 自动收集以下指标。

收集的指标取决于您使用的 HAProxy 入口版本。有关 HAProxy 入口及其版本的更多信息,请参阅haprox-In

指标名称 Dimensions 可用性

haproxy_backend_bytes_in_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_backend_bytes_out_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_backend_connection_errors_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_backend_connections_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_backend_current_sessions

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_backend_http_responses_total

ClusterName,Namespace,Service,code,backend

所有版本的 HAProxy 入口

haproxy_backend_status

ClusterName,Namespace,Service

仅适用于 0.10 或更高版本的 HAProxy 入口

haproxy_backend_up

ClusterName,Namespace,Service

仅适用于早于 0.10 的 HAProxy 入口版本

haproxy_frontend_bytes_in_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_bytes_out_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_connections_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_current_sessions

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_http_requests_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_http_responses_total

ClusterName,Namespace,Service,code,frontend

所有版本的 HAProxy 入口

haproxy_frontend_request_errors_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

haproxy_frontend_requests_denied_total

ClusterName,Namespace,Service

所有版本的 HAProxy 入口

注意

code 维度的值可以是 1xx2xx3xx4xx5xxother

的值backend维度可以是:

  • http-default-backendhttp-shared-backend,或者httpsback-shared-backend适用于 0.0.27 或更早版本的 HAProxy 入口版本。

  • _default_backend对于低于 0.0.27 的 HAProxy 入口版本。

的值frontend维度可以是:

  • httpfront-default-backendhttpfront-shared-frontend,或者httpfronts适用于 0.0.27 或更早版本的 HAProxy 入口版本。

  • _front_http或者_front_https对于低于 0.0.27 的 HAProxy 入口版本。