配置简化的自动恢复
重要
以下信息适用于在运行正常的实例上配置与恢复相关的功能。如果您目前在访问实例时遇到困难,请参阅 EC2 实例问题排查。
为了让您的工作负载在成功恢复实例后正常运行,您的实例必须在无需手动干预的情况下启动并接受流量。
默认情况下,简化的自动恢复会监控所有支持的运行实例。如果检测到系统状态检查失败,则简化的自动恢复会尝试将实例修复到正常运行状态。简化的自动恢复在 Amazon Health Dashboard 中的服务事件期间不起作用。有关更多信息,请参阅 排查简化的自动恢复失败。
当发生简化的自动恢复事件时,您将收到 Amazon Health Dashboard 事件。要配置这些事件的通知,请参阅 Amazon 用户通知服务 用户指南中的开始使用 Amazon 用户通知服务。您还可以使用 Amazon EventBridge 规则通过以下事件代码监控简化的自动恢复事件:
-
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS
— 成功的事件 -
AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE
— 失败的事件
有关更多信息,请参阅 Amazon EventBridge 规则。
简化的自动恢复的要求和限制
简化的自动恢复将在实例符合以下条件时尝试恢复实例:
-
处于
running
状态。有关更多信息,请参阅 实例生命周期。 -
使用
default
(按需)或dedicated
实例租赁。有关更多信息,请参阅 实例购买选项。 -
属于 Amazon EC2 具有可用容量的实例类型。在某些情况下,例如严重中断,将没有充足的可用容量,并且某些恢复尝试可能会失败。
-
不使用
dedicated
实例租赁。对于 Amazon EC2 专属主机,您可以使用专属主机自动恢复功能自动恢复运行状况不佳的实例。 -
不使用 Elastic Fabric Adapter。
-
不是
metal
实例大小。 -
不是 Auto Scaling 组的成员。
-
目前未进行定期维护事件。
-
没有实例存储卷。
-
使用以下其中一种实例类型:
-
通用型:A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | T1 | T2 | T3 | T3a | T4g
-
计算优化型:C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i | C7i-flex
-
内存优化型:R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | u7i-12tb | u7in-16tb | u7in-24tb | u7in-32tb | X1 | X1e | X2iezn
-
加速计算型:G3 | G3s | G5g | Inf1 | P2 | P3 | VT1
-
高性能计算: Hpc6a | Hpc7a | Hpc7g
-
警告
-
如果停止实例,实例存储卷上的数据将丢失。有关停止实例的更多信息,请参阅 实例停止和启动(仅限 Amazon EBS 支持的实例)。
-
如果系统状态检查失败,则实例存储和块设备映射的数据可能会丢失。对于这些实例类型,您可以考虑使用 启用终止保护。
我们建议您定期创建宝贵数据的备份。有关 Amazon EC2 备份和恢复最佳实践的信息,请参阅 Amazon EC2 最佳实践。
配置简化的自动恢复
启动支持的实例时,默认情况下会启用简化的自动恢复。启动实例期间或之后,您可以将自动恢复行为设置为 disabled
。default
配置不能为不受支持的实例类型启用简化的自动恢复。
排查简化的自动恢复失败
以下问题可能会导致使用简化的自动恢复对实例进行恢复失败:
-
简化的自动恢复在 Amazon Health Dashboard 中的服务事件期间不起作用。您可能不会收到此类事件的恢复失败通知。要了解最新的服务可用性信息,请参阅服务运行
状况页面。 -
替换硬件的临时容量不足。
-
该实例已达到每天的恢复尝试操作限制。如果自动恢复失败,并且确定硬件性能下降是初始系统状态检查失败的根本原因,那么您的实例随后可能会被停用。
如果尽管多次尝试恢复,但实例的系统状态检查失败仍然存在,请参阅对状态检查失败的实例进行故障排除以获取更多指导。