Valkey 和 Redis OSS 基于节点的集群的指标和事件 - Amazon ElastiCache
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Valkey 和 Redis OSS 基于节点的集群的指标和事件

ElastiCache 提供了各种各样的指标和事件,用于监控 Valkey 和 Redis OSS 基于节点的集群。这包括通过 Amazon CLI 和 Amazon Simple Notification Service(SNS)提供的主机级指标、命令级指标和事件日志。

基于节点的集群的指标

当您创建基于节点的集群时,ElastiCache 会在各个节点级别发布指标,包括主机级别的指标和缓存指标。

有关主机级别指标的更多信息,请参阅主机级指标

有关节点级别指标的更多信息,请参阅Valkey 和 Redis OSS 的指标

基于节点的集群的事件(Valkey 和 Redis OSS)

ElastiCache 会记录与您基于节点的集群相关的事件。使用基于节点的集群时,您可以在 ElastiCache 控制台中、使用 Amazon CLI 或使用 Amazon Simple Notification Service(SNS)查看集群的事件。基于节点的集群的事件不会发布到 Amazon EventBridge。

基于节点的集群的事件信息包括事件的日期和时间、事件的源名称和源类型,以及事件的描述。通过使用 ElastiCache 控制台、Amazon CLI describe-events 命令或 ElastiCache API 操作 DescribeEvents,您可以轻松从日志中检索事件。

查看 ElastiCache 事件(控制台)

以下过程演示了使用 ElastiCache 控制台查看事件。

使用 ElastiCache 控制台查看事件

  1. 登录 Amazon Web Services 管理控制台 并打开 ElastiCache 控制台(https://console.aws.amazon.com/elasticache/)。

  2. 要查看所有可用事件的列表,请在导航窗格中选择 Events (事件)。

  3. 在“事件”屏幕上,列表的每一行表示一个事件,并显示事件源、事件类型、事件的 GMT 时间及事件的描述。通过使用 Filter,您可以指定是要查看事件列表中的所有事件,还是仅查看特定类型的事件。

查看 ElastiCache 事件()Amazon CLI

要使用 Amazon CLI 生成 ElastiCache 事件的列表,请使用命令 describe-events。您可以使用可选参数来控制所列事件的类型、所列事件的时间范围、要列出的事件的最大数目等。

以下代码列出最多 40 个基于节点的集群的事件。

aws elasticache describe-events --source-type cache-cluster --max-items 40

以下代码列出了过去 24 小时(1440 分钟)内的所有基于节点的缓存事件。

aws elasticache describe-events --source-type cache-cluster --duration 1440

基于节点的集群的事件

本部分包含对于基于节点的集群,预计您会收到的事件列表。

以下 ElastiCache 事件会触发 Amazon SNS 通知。有关事件详细信息的信息,请参阅 查看 ElastiCache 事件

事件名称 消息 描述

ElastiCache:AddCacheNodeComplete

ElastiCache:AddCacheNodeComplete : cache-cluster

缓存节点已添加到集群中,并准备就绪,可供使用。

由于空闲 IP 地址不足导致的 ElastiCache:AddCacheNodeFailed

ElastiCache:AddCacheNodeFailed : cluster-name

因为没有足够的可用 IP 地址,所以无法添加缓存节点。

ElastiCache:CacheClusterParametersChanged

ElastiCache:CacheClusterParametersChanged : cluster-name

一个或多个集群参数已更改。

ElastiCache:CacheClusterProvisioningComplete

ElastiCache:CacheClusterProvisioningComplete cluster-name-0001-005

集群预调配已完成,并且缓存集群中的缓存节点准备就绪,可供使用。

由于不兼容网络状态导致的 ElastiCache:CacheClusterProvisioningFailed

ElastiCache:CacheClusterProvisioningFailed : cluster-name

尝试将新集群启动到不存在的虚拟私有云(VPC)中。

ElastiCache:CacheClusterScalingComplete

CacheClusterScalingComplete : cluster-name

已成功完成缓存群集扩展。

ElastiCache:CacheClusterScalingFailed

ElastiCache:CacheClusterScalingFailed : cluster-name

对缓存群集的纵向扩展操作已失败。

ElastiCache:CacheClusterSecurityGroupModified

ElastiCache:CacheClusterSecurityGroupModified : cluster-name

发生下列事件之一:

  • 已修改授权用于集群的缓存安全组列表。

  • 已在与集群相关的任何缓存安全组上授权一个或多个新的 EC2 安全组。

  • 已从与集群相关的缓存安全组中撤销一个或多个 EC2 安全组。

ElastiCache:CacheNodeReplaceStarted

ElastiCache:CacheNodeReplaceStarted : cluster-name

ElastiCache 已检测到运行缓存节点的主机性能下降或无法访问,并已开始缓存节点的替换工作。

注意

针对替换之缓存节点的 DNS 分录未发生变化。

在大多数情况下,您无需在此事件发生时刷新适用于您的客户端的服务器列表。然而,某些缓存客户端库可能停止使用缓存节点,即使在 ElastiCache 已替换缓存节点之后亦是如此;在这种情况下,应用程序应该在此事件发生时刷新服务器列表。

ElastiCache:CacheNodeReplaceComplete

ElastiCache:CacheNodeReplaceComplete : cluster-name

ElastiCache 已检测到运行缓存节点的主机性能下降或无法访问,并已完成缓存节点的替换工作。

注意

针对替换之缓存节点的 DNS 分录未发生变化。

在大多数情况下,您无需在此事件发生时刷新适用于您的客户端的服务器列表。然而,某些缓存客户端库可能停止使用缓存节点,即使在 ElastiCache 已替换缓存节点之后亦是如此;在这种情况下,应用程序应该在此事件发生时刷新服务器列表。

ElastiCache:CacheNodesRebooted

ElastiCache:CacheNodesRebooted : cluster-name

一个或多个缓存节点已重启。

消息 (Memcached):"Cache node %s shutdown",然后是第二条消息:"Cache node %s restarted"

ElastiCache:CertificateRenewalComplete(仅限 Valkey 或 Redis OSS)

ElastiCache:CertificateRenewalComplete

已成功续订 Amazon CA 证书。

ElastiCache:CreateReplicationGroupComplete

ElastiCache:CreateReplicationGroupComplete : cluster-name

已成功创建复制组。

ElastiCache:DeleteCacheClusterComplete

ElastiCache:DeleteCacheClusterComplete : cluster-name

已完成集群和所有关联缓存节点的删除任务。

ElastiCache:FailoverComplete(仅限 Valkey 或 Redis OSS)

ElastiCache:FailoverComplete : mycluster

已成功故障转移至副本节点。

ElastiCache:ReplicationGroupIncreaseReplicaCountFinished

ElastiCache:ReplicationGroupIncreaseReplicaCountFinished : cluster-name-0001-005

已增加集群中的副本数量。

ElastiCache:ReplicationGroupIncreaseReplicaCountStarted

ElastiCache:ReplicationGroupIncreaseReplicaCountStarted : cluster-name-0003-004

已开始向集群添加副本的过程。

ElastiCache:NodeReplacementCanceled

ElastiCache:NodeReplacementCanceled : cluster-name

计划替换的集群中的节点不再计划替换。

ElastiCache:NodeReplacementRescheduled

ElastiCache:NodeReplacementRescheduled : cluster-name

之前计划替换的集群中的节点已计划在通知中所述的新时段内替换。

有关您可以执行的操作的信息,请参阅 替换节点(Valkey 和 Redis OSS)

ElastiCache:NodeReplacementScheduled

ElastiCache:NodeReplacementScheduled : cluster-name

您集群中的节点计划在通知所述的时段内替换。

有关您可以执行的操作的信息,请参阅 替换节点(Valkey 和 Redis OSS)

ElastiCache:RemoveCacheNodeComplete

ElastiCache:RemoveCacheNodeComplete : cluster-name

缓存节点已从集群中移除。

ElastiCache:ReplicationGroupScalingComplete

ElastiCache:ReplicationGroupScalingComplete : cluster-name

已成功完成对复制组的纵向扩展操作。

ElastiCache:ReplicationGroupScalingFailed

"Failed applying modification to cache node type to %s."

对复制组的纵向扩展操作失败。

ElastiCache:ServiceUpdateAvailableForNode

"Service update is available for cache node %s."

自助服务更新可用于节点。

ElastiCache:SnapshotComplete(仅限 Valkey 或 Redis OSS)

ElastiCache:SnapshotComplete : cluster-name

缓存快照已成功完成。

ElastiCache:SnapshotFailed(仅限 Valkey 或 Redis OSS)

SnapshotFailed : cluster-name

缓存快照失败。有关失败原因的详细信息,请参阅该集群的缓存事件。

要对快照加以说明,请参阅 DescribeSnapshots,状态将是 failed