本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
ARC 中区域切换的最佳实践
我们建议采用以下最佳实践通过 Amazon 应用程序恢复控制器(ARC)中的区域切换做好恢复和失效转移准备。
主题
- 确保专门构建、使用寿命长的 Amazon 凭证安全且始终可访问
在灾难恢复 (DR) 场景中,通过使用一种简单的方法来访问 Amazon 和执行恢复任务,将系统依赖性降至最低。专为 DR 任务创建 IAM 长效凭证,并将凭证安全地保存在本地物理保险箱或虚拟保管库中,以便在需要时进行访问。借助 IAM,您可以集中管理安全证书,例如访问密钥和 Amazon 资源访问权限。对于非 DR 任务,我们建议您继续使用 Amazon 单点登录
等 Amazon 服务进行联合访问。 - 为故障转移中涉及的 DNS 记录选择较低的 TTL 值
对于在失效转移机制中可能需要更改的 DNS 记录,尤其是经过运行状况检查的记录,使用较低的 TTL 值是合适的做法。在这种情况下,通常选择将 TTL 设置为 60 秒或 120 秒。
DNS TTL(生存时间)设置会告诉 DNS 解析器在一条记录缓存多长时间后再请求新记录。选择 TTL 时,要在延迟和可靠性与应变能力之间进行权衡。如果记录的 TTL 较短,DNS 解析器将更快地注意到记录的更新,因为 TTL 指定了它们必须更频繁地查询。
有关更多信息,请参阅 Amazon Route 53 DNS 最佳实践中的为 DNS 记录选择 TTL 值。
- 为关键应用程序保留所需的容量
区域切换包括执行块类型,可在恢复过程中帮助扩展计算资源。如果您在计划中使用这些执行块,则区域切换并不能保证获得所需的计算容量。如果您有关键应用程序并且需要保证容量的访问权限,我们建议您预留容量。
您可以遵循一些策略来预留辅助区域的计算容量,同时还可以限制成本。要了解更多信息,请参阅 Pilot light 与预留容量:如何使用按需容量预留优化灾难恢复成本
。 - 使用极其可靠的数据面板 API 操作列出和获取有关区域切换计划的信息
在活动期间,使用数据面板 API 操作来处理和执行您的区域切换计划。有关区域切换数据面板操作的列表,请参阅 区域切换 API 操作。
每个区域的区域切换控制台使用数据面板操作来执行区域切换计划。您也可以使用调用数据平面 API 操作, Amazon CLI 或者通过运行使用其中一个编写的代码来调用数据平面 API 操作 Amazon SDKs。ARC 数据面板中的 API 极其可靠。
- 使用 ARC 测试应用程序恢复
使用 ARC 区域交换机定期测试应用程序恢复,以激活另一个区域中的辅助应用程序堆栈 Amazon Web Services 区域,或者通过运行区域切换计划来停用其中一个区域来切换主动-主动配置。
务必要确保您创建的区域切换计划与堆栈中的正确资源保持一致,并且一切都按预期运行。您应该在为您的环境设置好区域切换之后进行该测试,并继续定期进行测试,以便验证恢复过程是否正常运行。在遇到故障情况之前,请定期进行此项测试,以帮助避免用户停机。
- ARC 区域交换机 DNS 故障转移对比 Route 53 加速恢复
-
加速恢复提供了 60 分钟的目标 RTO, APIs 用于更新启用此功能的公共托管区域记录。如果您需要保持对 RTO 的控制而不是等待 Amazon APIs 所需的 RTO 的完全恢复,则应使用 ARC Routing 控制或 ARC Region 切换 Route 53 运行状况检查执行块。