Amazon CloudWatch
用户指南
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

Amazon Elasticsearch Service 指标和维度

Amazon Elasticsearch Service 每分钟向 CloudWatch 发送一次数据。您可以使用 Amazon Elasticsearch Service 指标和维度 创建警报。有关更多信息,请参阅 Amazon Elasticsearch Service 开发人员指南 中的使用 Amazon CloudWatch 监控群集指标和统计数据

Amazon Elasticsearch Service 指标

AWS/ES 命名空间包括以下群集指标。

指标 描述
ClusterStatus.green

指示将所有索引分片分配给群集中的节点。

相关统计数据:Minimum、Maximum

ClusterStatus.yellow 指示所有索引的主要分片分配给群集中的节点,但是至少有一个索引的分片副本不是如此。单节点群集始终初始化为此群集状态,因为不存在可将副本分配给的另一个节点。您可以增加节点计数来获取绿色群集状态,也可以使用 Elasticsearch API 将索引的 number_of_replicas 设置设为 0。有关更多信息,请参阅 Elasticsearch 文档中的配置 Amazon Elasticsearch Service 域更新索引设置

相关统计数据:Minimum、Maximum

ClusterStatus.red

指示至少一个索引的主分片和副本分片未分配给群集中的节点。此状态的常见原因是群集中一个或多个数据节点的可用存储空间不足。反之,缺少可用存储空间会阻止服务将副本分片分配到受影响的数据节点,并且所有新索引都以红色群集状态开始。要恢复,您必须对现有数据节点添加基于 EBS 的存储、使用较大的实例类型、删除并从快照还原索引。有关更多信息,请参阅红色群集状态

相关统计数据:Minimum、Maximum

Nodes

Amazon ES 群集中的节点数。

相关统计数据:Minimum、Maximum、Average

SearchableDocuments

群集中所有索引中的可搜索文档的总数。

相关统计数据:Minimum、Maximum、Average

DeletedDocuments

群集中所有索引中的已删除文档的总数。

相关统计数据:Minimum、Maximum、Average

CPUUtilization

用于群集中的数据节点的 CPU 资源的最大百分比。

相关统计数据:Maximum、Average

FreeStorageSpace

群集中所有数据节点的可用空间(以 MB 为单位)。当该指标达到 0 时,Amazon ES 将引发 ClusterBlockException。要恢复,您必须删除索引,添加更大的实例,或向现有实例添加基于 EBS 的存储。有关更多信息,请参阅从缺少可用存储空间恢复

注意

FreeStorageSpace 将始终小于 Elasticsearch _cluster/stats API 提供的值。Amazon ES 在每个实例上为内部操作预留一个存储空间百分比。

相关统计数据:Minimum

ClusterUsedSpace

群集的已使用空间总量(以 MB 为单位)。您可以在 Amazon CloudWatch 控制台而不是 Amazon ES 控制台中查看此指标。

相关统计数据:Minimum、Maximum

ClusterIndexWritesBlocked

指示您的群集是接受还是阻止传入的写入请求。值为 0 表示群集接受请求。值为 1 表示阻止请求。

许多因素都可能导致群集开始阻止请求。一些常见的因素包括:FreeStorageSpace 过低、JVMMemoryPressure 过高、或 CPUUtilization 过高。为了缓解这一问题,可以考虑增加磁盘空间或扩展群集。

相关统计数据:Maximum

注意

您可以在 Amazon CloudWatch 控制台而不是 Amazon ES 控制台中查看此指标。

JVMMemoryPressure

用于群集中所有数据节点的 Java 堆的最大百分比。

相关统计数据:Maximum

AutomatedSnapshotFailure

群集的失败的自动快照的数量。值 1 指示在过去的 36 个小时内未为域拍摄自动快照。

相关统计数据:Minimum、Maximum

CPUCreditBalance

群集中的数据节点可用的剩余 CPU 积分。一个 CPU 积分提供一个完整 CPU 核心在一分钟内的性能。有关更多信息,请参阅 Amazon EC2 开发人员指南 中的 CPU 积分。此指标仅适用于 t2.micro.elasticsearch、t2.small.elasticsearch 和 t2.medium.elasticsearch 实例类型。

相关统计数据:Minimum

KibanaHealthyNodes

Kibana 运行状况检查。值为 1 表示行为正常。值为 0 表示无法访问 Kibana。在大多数情况下,Kibana 的运行状况反映了群集的运行状况。

相关统计数据:Minimum

注意

您可以在 Amazon CloudWatch 控制台而不是 Amazon ES 控制台中查看此指标。

AWS/ES 命名空间包括专用主节点的以下指标。

指标 描述
MasterCPUUtilization

专用主节点使用的 CPU 资源的最大百分比。建议在此指标达到 60% 时增加实例类型的大小。

相关统计数据:Average

MasterFreeStorageSpace

此指标不相关,可以被忽略。该服务不使用主节点作为数据节点。

MasterJVMMemoryPressure

用于群集中所有专用主节点的 Java 堆的最大百分比。建议在此指标达到 85% 时迁移到更大的实例类型。

相关统计数据:Maximum

MasterCPUCreditBalance

群集中专用主节点可用的剩余 CPU 积分。一个 CPU 积分提供一个完整 CPU 核心在一分钟内的性能。有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例) 中的 CPU 积分。此指标仅适用于 t2.micro.elasticsearch、t2.small.elasticsearch 和 t2.medium.elasticsearch 实例类型。

相关统计数据:Minimum

MasterReachableFromNode

MasterNotDiscovered 运行状况检查异常。值为 1 表示行为正常。值为 0 表示 /_cluster/health/ 失败。

失败意味着主节点已停止或无法访问。这通常是由网络连接问题或 AWS 依赖问题导致的。

相关统计数据:Minimum

注意

您可以在 Amazon CloudWatch 控制台而不是 Amazon ES 控制台中查看此指标。

AWS/ES 命名空间包括 EBS 卷的以下指标。

指标 描述
ReadLatency

EBS 卷上读取操作的延迟(以秒为单位)。

相关统计数据:Minimum、Maximum、Average

WriteLatency

EBS 卷上写入操作的延迟(以秒为单位)。

相关统计数据:Minimum、Maximum、Average

ReadThroughput

EBS 卷上读取操作的吞吐量(以字节/秒为单位)。

相关统计数据:Minimum、Maximum、Average

WriteThroughput

EBS 卷上写入操作的吞吐量(以字节/秒为单位)。

相关统计数据:Minimum、Maximum、Average

DiskQueueDepth

针对 EBS 卷的待处理输入和输出 (I/O) 请求的数量。

相关统计数据:Minimum、Maximum、Average

ReadIOPS

针对 EBS 卷上的读取操作的每秒输入和输出 (I/O) 操作数。

相关统计数据:Minimum、Maximum、Average

WriteIOPS

针对 EBS 卷上的写入操作的每秒输入和输出 (I/O) 操作数。

相关统计数据:Minimum、Maximum、Average

Amazon Elasticsearch Service 指标的维度

要筛选这些指标,请使用以下维度。

维度 描述

ClientId

AWS 账户 ID。

DomainName

搜索域的名称。