Amazon CloudWatch 中的跨区域数据复制指标 - Amazon MQ
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon CloudWatch 中的跨区域数据复制指标

Amazon MQ for ActiveMQ 跨区域数据复制功能提供了用于维护主代理和副本代理的可靠性、可用性和性能的指标。在复制过程中,辅助区域中的副本代理从主区域中的主代理接收异步复制的数据。如果主区域中的主代理出现故障,则可以通过启动切换或失效转移,将辅助区域中的副本代理提升为主代理。有关在 Amazon CloudWatch 中查看指标的说明,请参阅访问 Amazon MQ 的 CloudWatch 指标

CRDR 时间戳

以下时间戳描述如何计算在 Amazon CloudWatch 中找到的指标。数据复制过程中有五个时间戳:

  • 当前观测时间(TCO):当前瞬间。

  • 创建时间(TC):主代理在复制队列上创建事件的瞬间。在主代理和副本代理上均可用。

  • 交付时间(TD):事件成功交付给副本代理的瞬间。仅在副本代理上可用。

  • 处理时间 (TP):副本代理成功处理事件的瞬间。仅在副本代理上可用。

  • 确认时间(TA):主代理成功确认事件的瞬间。仅在主代理上可用。

使用 CRDR CloudWatch 指标估算切换/失效转移性能

默认情况下,Amazon MQ 将会为您的代理启用指标。您可以通过访问 Amazon CloudWatch 控制台或者通过使用 CloudWatch API 查看您的代理指标。以下指标对于了解 CRDR 代理的复制和切换/失效转移性能很有用:

Amazon MQ CloudWatch 指标 使用 CRDR 的原因
TotalReplicationLag 主代理上最后一个未确认事件的 TA 和 TC 之间的估计时间。
ReplicationLag 副本代理上最后一个未确认事件的 TP 和 TC 之间的估计时间。
PrimaryWaitTime 主代理上最后一个处理的事件的 TCO 和 TC 之间的估计时间。
ReplicaWaitTime 副本代理上最后一个处理的事件的 TCO 和 TP 之间的估计时间。
QueueSize 主代理上复制队列中未确认的事件总数。

TotalReplicationLagReplicationLag 描述主代理和副本代理之间的延迟复制。这两个指标还可用于估计完成正在进行的切换或失效转移操作所需的时间。

PrimaryWaitTimeReplicaWaitTime 可用于确定复制过程中正在发生的任何问题。如果此指标的值持续增长,则可能表明复制过程已降级或暂停。由于网络分区、代理启动和恢复时间长等问题,可能会导致复制缓慢。