使用 Amazon FIS 测试可用区自动转移
您可以使用 Amazon Fault Injection Service来设置和运行实验,以帮助您模拟真实环境,例如“可用区可用性:电源中断”场景,该场景将演示在可用区可能大范围受影响的期间,Amazon 在启用了自动转移的资源上启动可用区自动转移时会发生什么。
启动 aws:arc:start-zonal-autoshift 恢复操作,您可以演示在执行可用区可用性的场景中,Amazon 如何将启用了可用区自动转移的资源的流量从可能受影响的可用区自动转移出去,并将其重新路由到同一 Amazon Web Services 区域中运行状况良好的可用区。
例如,您可以使用 Amazon FIS 场景库来模拟由电源中断引起可用区受影响这一情况。在本实验中,在可用区电源中断开始五分钟后,恢复操作 aws:arc:start-zonal-autoshift 会自动将资源流量从指定可用区转移出去。在电源中断的后 25 分钟内,流量会被转移出去,以演示在可用区可能大范围受影响时如何触发自动转移。实验完成后,流量转移结束,流量再次开始流向所有可用区。此过程演示了如何从影响可用区的电源事件中完全恢复。
实验与可用区自动转移练习运行有何不同
Amazon FIS 实验与可用区自动转移练习运行的不同之处在于,在练习运行期间,ARC 会将您的资源流量从一个可用区转移出去,这是正常流程的一部分,以确保您的应用程序能够在丢失一个可用区的情况下正常运行。但是,在 Amazon FIS 实验中,Amazon FIS 演示了如何在可用区受影响时,代表您为启用了自动转移的资源触发自动转移,然后在问题得到解决后取消自动转移。
在 Amazon FIS 发起的可用区转移运行期间,您无法对其进行更新。此外,如果您在 Amazon FIS 外面取消可用区转移,则 Amazon FIS 实验会结束。
基于 Amazon FIS 到期时间的安全机制
Amazon FIS 使用 StartZonalShift、UpdateZonalShift 和 CancelZonalShift API 操作管理可用区转移,通过将这些请求的 expiresIn 字段设置为 1 分钟来作为一种安全机制。这使得 Amazon FIS 在出现意外事件(例如网络中断或系统问题)时可以快速回滚可用区转移。在 ARC 控制台中,“到期时间”字段将显示“Amazon FIS 托管”,实际的预期到期时间由可用区转移操作中指定的持续时间决定。有关练习运行的更多信息,请参阅可用区自动转移和练习运行的工作原理
在给定时间,应用的可用区转移不能超过一个。也就是说,资源只能有一个练习运行可用区转移、客户发起的可用区转移或自动转移,或 Amazon FIS 实验。当启动第二次可用区转移时,ARC 会按照优先级来确定哪个可用区转移类型对资源有效。有关可用区转移优先级的更多信息,请参阅可用区转移的优先级。
有关 Amazon FIS 恢复操作的更多信息,请参阅《Amazon Fault Injection Service 用户指南》中的 Amazon FIS 恢复操作。