View a markdown version of this page

Amazon 应用程序恢复控制器(ARC)中的就绪检查是什么? - Amazon 应用程序恢复控制器(ARC)
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon 应用程序恢复控制器(ARC)中的就绪检查是什么?

注意

Amazon 应用程序恢复控制器 (ARC) 中的准备情况检查功能不再向新客户开放。现有客户可以继续正常使用该服务。有关更多信息,请参阅 Amazon 应用程序恢复控制器 (ARC) 准备情况检查可用性变更

ARC 中的准备情况检查持续(每隔一分钟),审核检查中包含的资源的 Amazon 预配置容量、服务配额、油门限制以及配置和版本差异方面的不匹配情况。就绪检查可以将这些差异通知给您,这样您就可以确保每个副本具有相同的配置设置和相同的运行时状态。尽管就绪检查可确保您在副本之间配置的容量一致,但不应期待就绪检查能代表您决定副本的容量应该是多少。例如,您应该了解应用程序需求,在设定自动扩缩组的大小时在每个副本中留足缓冲容量,以应对另一个单元格不可用的情况。

当 ARC 通过就绪检查检测到配额不匹配时,它可以采取措施调整副本的配额,通过增加较低的配额,使之与较高的配额相匹配。当限额匹配时,就绪检查状态显示 READY。(请注意,这个过程不是立即更新的,总时间取决于特定的资源类型和其他因素。)

第一步是设置就绪检查,以创建代表应用程序的恢复组。每个恢复组都包括应用程序的每个故障控制单位或副本的对应单元格。接下来,为应用程序中的每种资源类型创建资源集,并将就绪检查与资源集关联起来。最后,您可以将资源与就绪范围相关联,这样您就可以获得恢复组(您的应用程序)或各个单元格 [副本,即区域或可用区 (AZ)] 中资源的就绪状态。

就绪状态(即 READYNOT READY)基于就绪检查范围内的资源和某一资源类型的规则集。每种资源类型都有一组就绪规则,ARC 检查使用这些规则来审计资源的就绪情况。资源是否 READY 取决于每条就绪规则的定义方式。所有就绪规则都会评估资源,但有些规则会对资源进行比较,有些则会查看有关资源集中每种资源的具体信息。

通过添加就绪检查,您可以通过以下几种方式之一监控就绪状态:使用 EventBridge、在 ARC API 操作中或使用 ARC API 操作。 Amazon Web Services 管理控制台您还可以在不同的上下文中监控资源的就绪状态,包括单元格的就绪情况和应用程序的就绪情况。使用 ARC 中的跨账户授权功能,可以更轻松地设置和监控来自单个 Amazon 账户的分布式资源。

通过就绪检查监控应用程序副本

ARC 使用就绪检查审计应用程序副本,以确保每个副本有相同的配置设置和相同的运行时状态。就绪性检查会持续审核应用程序的 Amazon 资源容量、配置、 Amazon 配额和路由策略,这些信息可用于帮助确保副本已准备好进行故障转移。就绪检查有助于确保您的恢复环境经过扩展和配置,可在需要时进行失效转移。

以下各部分提供了有关就绪检查工作原理的更多详细信息。

就绪检查和应用程序副本

为了做好恢复准备,您必须始终保持足够的备用容量,以吸收来自其他可用区或区域的失效转移流量。ARC 会持续(每分钟一次)检查您的应用程序,以确保所有可用区或区域上的预调配容量相匹配。

例如,ARC 检查的容量包括 Amazon EC2 实例数量、Aurora 读取和写入容量单位以及 Amazon EBS 卷大小。如果您在主副本中纵向扩展资源的容量值,但忘记同时增加备用副本中的相应值,ARC 会检测到不匹配情况,以便您可以增加备用副本中的值。

重要

就绪检查非常有助于持续验证应用程序副本配置和运行时状态是否一致。您不该使用就绪检查来指示生产副本是否正常,也不该依赖就绪检查作为灾难事件期间失效转移的主要触发条件。

在主动-备用配置中,您应该根据监控和运行状况检查系统来确定是否从某单元格或向某单元格进行失效转移,并考虑将就绪检查作为这些系统的补充服务。ARC 就绪检查的可用性不高,因此您不应在中断期间依赖检查的可用性。此外,在灾难事件发生期间,所检查的资源也可能不可用。

您可以监控特定单元(Amazon 区域或可用区)中应用程序资源的就绪状态,也可以监控整个应用程序的就绪状态。例如,通过在中创建规则,您可以在准备检查状态更改时收到通知 EventBridge。Not ready有关更多信息,请参阅 在 Amazon 上使用 ARC 中的准备情况检查 EventBridge。您还可以在中查看就绪状态 Amazon Web Services 管理控制台,或者使用 API 操作(例如)来查看就绪状态get-recovery-readiness。有关更多信息,请参阅 就绪检查 API 操作

就绪检查的工作原理

ARC 使用就绪检查审计应用程序副本,以确保每个副本有相同的配置设置和相同的运行时状态。

例如,为了做好恢复准备,您必须始终保持足够的备用容量,以吸收来自其他可用区或区域的失效转移流量。ARC 会持续(每分钟一次)检查您的应用程序,以确保所有可用区或区域上的预调配容量相匹配。例如,ARC 检查的容量包括 Amazon EC2 实例数量、Aurora 读取和写入容量单位以及 Amazon EBS 卷大小。如果您在主副本中纵向扩展资源的容量值,但忘记同时增加备用副本中的相应值,ARC 会检测到不匹配情况,以便您可以增加备用副本中的值。

重要

就绪检查非常有助于持续验证应用程序副本配置和运行时状态是否一致。您不该使用就绪检查来指示生产副本是否正常,也不该依赖就绪检查作为灾难事件期间失效转移的主要触发条件。

在主动-备用配置中,您应该根据监控和运行状况检查系统来确定是否从某单元格或向某单元格进行失效转移,并考虑将就绪检查作为这些系统的补充服务。ARC 就绪检查的可用性不高,因此您不应在中断期间依赖检查的可用性。此外,在灾难事件发生期间,所检查的资源也可能不可用。

您可以监控特定单元(Amazon 区域或可用区)中应用程序资源的就绪状态,也可以监控整个应用程序的就绪状态。例如,通过在中创建规则,当准备情况检查状态更改为(变为)时Not ready,您会收到通知 EventBridge。有关更多信息,请参阅 在 Amazon 上使用 ARC 中的准备情况检查 EventBridge。您还可以在中查看就绪状态 Amazon Web Services 管理控制台,或者使用 API 操作(例如)来查看就绪状态get-recovery-readiness。有关更多信息,请参阅 就绪检查 API 操作