Amazon EKS 和 Kubernetes Container Insights 指标 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

Amazon EKS 和 Kubernetes Container Insights 指标

下表列出了 Container Insights 收集的针对 Amazon EKS 和 Kubernetes 的指标和维度。这些指标位于 ContainerInsights 命名空间中。有关更多信息,请参阅 指标

如果您在控制台中未看到任何 Container Insights 指标,请确保已完成 Container Insights 的设置。在完全设置 Container Insights 之前,指标不会显示。有关更多信息,请参阅 设置 Container Insights

当您使用 Container Insights 收集以下指标时,这些指标将作为自定义指标收费。有关 CloudWatch 定价的更多信息,请参阅 Amazon CloudWatch 定价

指标名称 Dimensions 说明

cluster_failed_node_count

ClusterName

集群中失败的工作线程节点的数目。如果节点遭受任何节点条件的影响,则该节点被视为失败。有关更多信息,请参阅 Kubernetes 文档中的条件

cluster_node_count

ClusterName

集群中工作线程节点的总数。

namespace_number_of_running_pods

Namespace、ClusterName

ClusterName

您使用的维度所指定的资源中每个命名空间运行的 pod 的数目。

node_cpu_limit

ClusterName

可以分配给此集群中单个节点的 CPU 单元的最大数目。

node_cpu_reserved_capacity

NodeName、ClusterName、InstanceId

ClusterName

为节点组件保留的 CPU 单元的百分比,例如 kubelet、kube-proxy 和 Docker。

node_cpu_usage_total

ClusterName

集群中节点上正在使用的 CPU 单元的数目。

node_cpu_utilization

NodeName、ClusterName、InstanceId

ClusterName

集群中节点上正在使用的 CPU 单元的总百分比。

node_filesystem_utilization

NodeName、ClusterName、InstanceId

ClusterName

集群中节点上正在使用的文件系统容量的总百分比。

node_memory_limit

ClusterName

可以分配给此集群中单个节点的最大内存量(以字节为单位)。

node_memory_reserved_capacity

NodeName、ClusterName、InstanceId

ClusterName

集群中节点上当前正在使用的内存百分比。

node_memory_utilization

NodeName、ClusterName、InstanceId

ClusterName

一个或多个节点当前正在使用的内存百分比。

node_memory_utilization 的计算方法为 node_memory_working_set/node_memory_limit。它是节点内存使用量相比节点内存限制的百分比。

node_memory_working_set

ClusterName

集群中节点的工作集中正在使用的内存量(以字节为单位)。

node_network_total_bytes

NodeName、ClusterName、InstanceId

ClusterName

集群中每个节点通过网络传输和接收的每秒总字节数。

node_number_of_running_containers

NodeName、ClusterName、InstanceId

ClusterName

集群中每个节点的正在运行的容器数。

node_number_of_running_pods

NodeName、ClusterName、InstanceId

ClusterName

集群中每个节点上运行的 pod 的数量。

pod_cpu_reserved_capacity

PodName、Namespace、ClusterName

ClusterName

集群中每个 pod 预留的 CPU 容量。

pod_cpu_utilization

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

pod 所使用的 CPU 单元的百分比。

pod_cpu_utilization_over_pod_limit

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

超出 pod 限制的 pod 所使用的 CPU 单元的百分比。

pod_memory_reserved_capacity

PodName、Namespace、ClusterName

ClusterName

为 pod 预留的内存的百分比。

pod_memory_utilization

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

一个或多个 pod 当前正在使用的内存百分比。

pod_memory_utilization_over_pod_limit

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

超出 pod 限制的 pod 所使用的内存百分比。

pod_number_of_container_restarts

PodName、Namespace、ClusterName

一个 pod 中容器重新启动的总次数。

pod_network_rx_bytes

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

pod 通过网络每秒接收的字节数。

pod_network_tx_bytes

PodName、Namespace、ClusterName

Namespace、ClusterName

Service、Namespace、ClusterName

ClusterName

pod 通过网络每秒传输的字节数。

service_number_of_running_pods

Service、Namespace、ClusterName

ClusterName

运行集群中的服务的 pod 的数量。