Amazon ElastiCache
用户指南 (API Version 2015-02-02)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。请点击 Amazon AWS 入门,可查看中国地区的具体差异

应监控哪些指标?

通过以下 CloudWatch 指标可深入了解 ElastiCache 性能。在许多情况下,我们建议对这些指标设置 CloudWatch 警报,以便您可以在性能问题出现之前采取纠正措施。

CPU 利用率

这是以百分比形式报告的主机级指标。有关更多信息,请参阅 主机级指标

  • Memcached:因为 Memcached 是多线程的,所以此指标可能高达 90%。如果超过此阈值,请使用更大的缓存节点类型扩展缓存集群,或通过添加更多缓存节点进行扩展。

  • Redis:因为 Redis 是单线程的,所以阈值的计算方式为 (90/处理器核心数)。例如,假设您使用具有四个核心的 cache.m1.xlarge 节点。在这种情况下,CPUUtilization 的阈值为 (90/4),即 22.5%。

    您需要根据所使用的缓存节点中的核心数,来确定自己的阈值。如果超过此阈值,并且主要工作负载来自读取请求,则请通过添加只读副本来扩展缓存集群。如果主要工作负载来自写入请求,则我们建议使用更大的缓存实例类型来进行扩展。

SwapUsage

这是以字节为单位报告的主机级指标。有关更多信息,请参阅 主机级指标

  • Memcached:此指标不应超过 50 MB。如果超过,则我们建议您增大 ConnectionOverhead 参数值

  • Redis:当前,我们对于该参数没有建议;您无需为其设置 CloudWatch 警报。

移出

这是为 Memcached 和 Redis 缓存集群发布的缓存引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

  • Memcached:如果超过所选阈值,请使用更大的节点类型纵向扩展集群,或通过添加更多节点来横向扩展。

  • Redis:如果超过所选阈值,请使用更大的节点类型来纵向扩展集群。

CurrConnections

这是为 Memcached 和 Redis 缓存集群发布的缓存引擎指标。我们建议您根据应用程序需求,为此指标确定自己的警报阈值。

无论是运行 Memcached 还是 Redis,当前连接 的数量不断增加,都可能表示应用程序出现问题;您需要调查应用程序行为以解决此问题。