本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
练习运行警报
在区域自动切换中,您可以为练习跑指定两种类型的 CloudWatch 警报:结果警报和阻塞警报。
- 结果警报(必填)
对于第一种类型的警报,即结果警报,至少需要指定一个警报。您应该配置结果警报,以便在每次为期 30 分钟的练习运行期间,在将流量从可用区转移出去时监控应用程序的运行状况。
为了使练习生效,请将至少一个符合以下两个条件的 CloudWatch 警报指定为结果警报:
警报监控资源或应用程序的指标
AND
当应用程序因丢失一个可用区而受到不利影响时,警报会以
ALARM状态进行响应。有关更多信息,请参阅 配置可用区自动转移的最佳实践中的为练习运行指定的警报部分。
结果警报还提供了 ARC 针对每次练习运行所报告的练习运行结果的信息。如果结果警报进入
ALARM状态,ARC 将结束练习运行并返回练习运行的FAILED结果。如果练习运行完成了 30 分钟的计划测试期,并且您指定的任何结果警报均未进入ALARM状态,则结果将返回SUCCEEDED。练习运行结果部分提供了所有结果值的列表及其描述。- 阻止警报(可选)
您也可以选择指定第二个警报类型,即阻止警报。在一个或多个警报处于
ALARM状态时,阻止警报将阻止练习运行启动或继续。当至少一个警报处于ALARM状态时,阻止警报会阻止练习运行流量转移启动,并停止任何正在进行的练习运行。例如,在具有多个微服务的大型架构中,当一个微服务遇到问题时,您通常希望停止应用程序环境中的所有其它更改,其中包括阻止练习运行。您可以在 ARC 中添加阻止警报来完成此操作。