用于 Redis 的 Amazon ElastiCache
ElastiCache for Redis 用户指南 (API 版本 2015-02-02)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

应监控哪些指标?

通过以下 CloudWatch 指标可深入了解 ElastiCache 性能。在许多情况下,我们建议对这些指标设置 CloudWatch 警报,以便您可以在性能问题出现之前采取纠正措施。

CPU 使用率

这是以百分比形式报告的主机级指标。有关更多信息,请参阅 主机级指标

对于有 2 个或更少 vCPU 的较小节点类型,可使用 CPUUtilization 指标来监控工作负载。

一般来说,我们建议您将阈值设置为可用 CPU 的 90%。因为 Redis 是单线程的,实际阈值应计算为节点总容量的一小部分。例如,假设您使用具有两个核心的节点类型。在这种情况下,CPU 使用率的阈值为 90/2,或 45%。要查找您的节点类型具有的核心 (vCPU) 数量,请参阅 Amazon ElastiCache 定价

您需要根据所使用的缓存节点中的核心数,来确定自己的阈值。如果超过此阈值,并且主要工作负载来自读取请求,则请通过添加只读副本来扩展缓存集群。如果主要工作负载来自写入请求,我们的建议取决于您的集群配置:

  • Redis (已禁用集群模式) 集群:使用更大的缓存实例类型进行扩展。

  • Redis (已启用集群模式) 集群:添加更多分片,在更多主节点中分配写入工作负载。

提示

Redis 用户可能能够使用向您报告有关 Redis 引擎核心的使用率百分比的 Redis 指标 EngineCPUUtilization,而不是使用主机级指标 CPUUtilization。要了解此指标在您的节点上是否可用并了解更多信息,请参阅 Redis 的指标

EngineCPUUtilization

对于有 4 个或更多 vCPU 的较大节点类型,您可能希望使用 EngineCPUUtilization 指标,该指标可以向您报告 Redis 引擎核心的使用率百分比。要了解此指标在您的节点上是否可用并了解更多信息,请参阅 Redis 的指标

交换区使用情况

这是以字节为单位报告的主机级指标。有关更多信息,请参阅 主机级指标

此指标不应超过 50 MB。如果超过此限制,请参阅以下主题:

移出

这是缓存引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

当前连接

这是缓存引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

当前连接的数量不断增加,可能表示应用程序出现问题;您需要调查应用程序行为以解决此问题。