关于区域切换
使用区域切换,您可以编排特定的步骤来切换在其中运行多区域应用程序的 Amazon Web Services 区域。
区域切换围绕计划概念构建,您可以根据特定的恢复需要来设计和配置这些计划。每个计划都包括由步骤组成的工作流程。一个步骤运行一个或多个执行块,区域切换并行或按顺序运行这些执行块,以完成应用程序恢复。每个执行块处理不同的任务,例如切换资源或管理应用程序的流量重定向。为了获得更大的灵活性,您可以通过添加子计划来创建嵌套计划。
每当您创建或更新计划时,区域切换都会执行计划评估,以确保 IAM 权限、资源配置或运行容量没有问题。区域切换定期运行这些评估,并针对它发现的任何问题生成警告。
区域切换还会计算每个计划执行的实际恢复时间值,以协助您评估该计划是否符合您的目标。您可以在 Amazon Web Services 管理控制台的区域切换控制面板中查看恢复时间和有关计划执行的其它详细信息。有关更多信息,请参阅 区域切换控制面板。
要了解有关区域切换中各个方面的更多信息,请参阅以下部分。
区域切换计划
区域切换计划是区域切换中的顶级资源。您应将计划范围限定为特定的多区域应用程序。计划使您能够通过运行一系列区域切换执行块来构建恢复应用程序的工作流程,这些执行块可以激活或停用您指定的 Amazon Web Services 区域中的应用程序及其资源,包括跨账户资源。
计划由一个或多个工作流程组成,使您可以激活或停用特定的 Amazon Web Services 区域。您可以将工作流程中的执行块配置为按顺序运行,也可以指定某些块并行运行。
对于为主动/被动多区域方法配置的计划,您可以创建一个可用于激活其中一个区域的工作流程,或者创建两个单独的激活工作流程,每个区域一个。对于为主动/主动方法配置的计划,您可以创建一个工作流程来激活您的区域,并创建一个工作流程来停用您的区域。
Amazon Web Services 区域是 Amazon 集群数据中心所在的全球地理位置。从设计而言,每个区域都与其他区域完全隔离,提供容错能力和稳定性。使用区域切换时,您需要考虑您的应用程序部署在哪些区域以及要使用哪些区域进行恢复。
区域切换支持在服务可用的任何两个 Amazon Web Services 区域之间进行恢复。配置区域切换计划时,需要指定应用程序的部署区域和使用的恢复方法:主动/被动或主动/主动。
例如,您可能采用主动/被动多区域方法,将 us-east-1 作为主区域,us-west-2 作为备用区域。要从影响 us-east-1 中应用程序的操作问题中恢复您的应用程序,您可以执行区域切换计划以激活 us-west-2。这将导致应用程序从 us-east-1 中的资源切换到 us-west-2 中的资源。
区域切换计划使用您创建计划时指定的 IAM 角色相关联的权限。
您可以为每个多区域应用程序创建多个计划,然后通过创建父计划按所需顺序协调这些计划的恢复。父计划是使用区域切换计划执行块作为步骤的计划。计划的层次结构仅限于两个级别(父级和子级),但您可以在同一个父计划下包括多个子计划。
工作流程和执行块
创建区域切换计划后,必须向计划中添加一个或多个工作流程,以定义您希望该计划为应用程序恢复执行的步骤。对于每个工作流程,您可以添加执行块以完成特定任务,例如纵向扩展资源或更新路由控制以重新路由流量。借助执行块可以指定这些任务及其完成顺序。通过创建嵌套计划,您还可以协调多个应用程序恢复到您要激活的区域的顺序。
您可以按顺序在工作流程中添加执行块,也可以并行添加一个或多个执行块。此外,根据资源的不同,您可以选择以优雅(计划内)或非优雅(计划外)的执行方式运行执行块。
-
优雅执行:计划的执行工作流程。当您的环境状况正常时,您可以使用优雅的工作流程来运行所有步骤,以便有序地执行计划。
-
非优雅执行:计划外执行。非优雅工作流程模式仅使用必要的步骤和操作。此模式要么更改工作流程中执行块的行为,要么跳过特定的执行块。
最后,您还可以为执行块配置跨账户资源。首先,您必须按照区域切换中的跨账户支持中的指导配置权限。设置所需的 IAM 角色后,您可以在计划工作流程的执行区块中添加跨账户资源。要添加跨账户资源,在添加执行块时,您需要指定一个拥有其他 Amazon Web Services 账户资源权限的目标 IAM 角色。您还必须为跨账户角色指定您在信任策略中提供的外部 ID。有关创建所需 IAM 角色的详细信息,请参阅跨账户资源权限。
要了解有关工作流程的更多信息,请参阅创建区域切换计划工作流程。有关每种执行块类型的详细信息,包括配置步骤、工作原理以及计划评估的内容,请参阅添加执行块。
计划评估
计划评估是一个自动流程,区域切换在创建或更新计划时运行,然后在稳定状态下每 30 分钟运行一次。评估过程会验证计划配置和资源配置的几个关键方面。评估包括验证 IAM 权限、资源配置和运行容量。
如果区域切换发现可能阻碍计划成功执行的问题,它会生成计划评估警告,该警告将在控制台的计划详细信息页面上突出显示。您也可以通过 Amazon EventBridge 查看计划评估警告,也可以使用区域切换 API 查看警告。
您可以在计划详细信息页面的计划评估选项卡中查看计划评估出现的问题的详细信息和建议的补救措施。我们建议您同时通过执行区域切换计划来测试应用程序恢复,并且不要仅仅依靠区域切换计划评估来测试恢复计划能否按预期运行。
区域警报和实际恢复时间
区域切换会计算每次计划执行的实际恢复时间值,您可以在计划执行后查看该值。实际恢复时间显示在计划执行详细信息页面上,因此您可以将实际时间与创建计划时指定的恢复时间目标进行比较。
实际恢复时间是根据计划执行完成所花费的总时间,以及您配置的特定 Amazon CloudWatch 警报恢复到绿色状态之前的任何额外时间计算的。
为了支持计算计划执行的准确实际恢复时间,请在区域切换计划中添加区域 Amazon CloudWatch 警报,这些警告可提供有关每个区域中应用程序运行状况的信号。执行计划时,区域切换会使用这些应用程序运行状况警报来确定您的应用程序何时恢复正常。然后,区域切换会根据您指定的应用程序运行状况警报,根据您的计划执行所需的时间,再加上应用程序恢复正常运行所需的时间,来计算实际恢复时间。
在将 CloudWatch 警报添加到区域切换计划之前,请确保您具有正确的 IAM 策略。有关更多信息,请参阅 针对应用程序运行状况权限的 CloudWatch 警报。