练习运行警报 - Amazon 应用程序恢复控制器(ARC)
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

练习运行警报

在区域自动切换中,您可以为练习跑指定两种类型的 CloudWatch 警报:结果警报和阻塞警报。

结果警报(必填)

对于第一种类型的警报,即结果警报,至少需要指定一个警报。您应该配置结果警报,以便在每次为期 30 分钟的练习运行期间,在将流量从可用区转移出去时监控应用程序的运行状况。

为了使练习生效,请将至少一个符合以下两个条件的 CloudWatch 警报指定为结果警报:

警报监控资源或应用程序的指标

AND

当应用程序因丢失一个可用区而受到不利影响时,警报会以 ALARM 状态进行响应。

有关更多信息,请参阅 配置可用区自动转移的最佳实践中的为练习运行指定的警报部分。

结果警报还提供了 ARC 针对每次练习运行所报告的练习运行结果的信息。如果结果警报进入 ALARM 状态,ARC 将结束练习运行并返回练习运行的 FAILED 结果。如果练习运行完成了 30 分钟的计划测试期,并且您指定的任何结果警报均未进入 ALARM 状态,则结果将返回 SUCCEEDED练习运行结果部分提供了所有结果值的列表及其描述。

阻止警报(可选)

您也可以选择指定第二个警报类型,即阻止警报。在一个或多个警报处于 ALARM 状态时,阻止警报将阻止练习运行启动或继续。当至少一个警报处于 ALARM 状态时,阻止警报会阻止练习运行流量转移启动,并停止任何正在进行的练习运行。

例如,在具有多个微服务的大型架构中,当一个微服务遇到问题时,您通常希望停止应用程序环境中的所有其它更改,其中包括阻止练习运行。您可以在 ARC 中添加阻止警报来完成此操作。