配置简化的自动恢复 - Amazon Elastic Compute Cloud
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

配置简化的自动恢复

重要
  • 以下信息适用于在运行正常的实例上配置与恢复相关的功能。如果您目前在访问实例时遇到困难,请参阅 EC2 实例问题排查

  • 为了让您的工作负载在成功恢复实例后正常运行,您的实例必须在无需手动干预的情况下启动并接受流量。

默认情况下,简化的自动恢复会监控所有支持的运行实例。如果检测到系统状态检查失败,则简化的自动恢复会尝试将实例修复到正常运行状态。简化的自动恢复在 Amazon Health Dashboard 中的服务事件期间不起作用。有关更多信息,请参阅 排查简化的自动恢复失败

当发生简化的自动恢复事件时,您将收到 Amazon Health Dashboard 事件。要配置这些事件的通知,请参阅 Amazon 用户通知服务 用户指南中的开始使用 Amazon 用户通知服务。您还可以使用 Amazon EventBridge 规则通过以下事件代码监控简化的自动恢复事件:

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_SUCCESS — 成功的事件

  • AWS_EC2_SIMPLIFIED_AUTO_RECOVERY_FAILURE — 失败的事件

有关更多信息,请参阅 Amazon EventBridge 规则

简化的自动恢复的要求和限制

简化的自动恢复将在实例符合以下条件时尝试恢复实例:

  • 处于 running 状态。有关更多信息,请参阅 实例生命周期

  • 使用 default(按需)或 dedicated 实例租赁。有关更多信息,请参阅 实例购买选项

  • 属于 Amazon EC2 具有可用容量的实例类型。在某些情况下,例如严重中断,将没有充足的可用容量,并且某些恢复尝试可能会失败。

  • 不使用 dedicated 实例租赁。对于 Amazon EC2 专属主机,您可以使用专属主机自动恢复功能自动恢复运行状况不佳的实例。

  • 不使用 Elastic Fabric Adapter。

  • 不是 metal 实例大小。

  • 不是 Auto Scaling 组的成员。

  • 目前未进行定期维护事件。

  • 没有实例存储卷。

  • 使用以下其中一种实例类型:

    • 通用型:A1 | M3 | M4 | M5 | M5a | M5n | M5zn | M6a | M6g | M6i | M6in | M7a | M7g | M7i | M7i-flex | T1 | T2 | T3 | T3a | T4g

    • 计算优化型:C3 | C4 | C5 | C5a | C5n | C6a | C6g | C6gn | C6i | C6in | C7a | C7g | C7gn | C7i | C7i-flex

    • 内存优化型:R3 | R4 | R5 | R5a | R5b | R5n | R6a | R6g | R6i | R6in | R7a | R7g | R7i | R7iz | u-3tb1 | u-6tb1 | u-9tb1 | u-12tb1 | u-18tb1 | u-24tb1 | u7i-12tb | u7in-16tb | u7in-24tb | u7in-32tb | X1 | X1e | X2iezn

    • 加速计算型:G3 | G3s | G5g | Inf1 | P2 | P3 | VT1

    • 高性能计算: Hpc6a | Hpc7a | Hpc7g

警告

我们建议您定期创建宝贵数据的备份。有关 Amazon EC2 备份和恢复最佳实践的信息,请参阅 Amazon EC2 最佳实践

配置简化的自动恢复

启动支持的实例时,默认情况下会启用简化的自动恢复。启动实例期间或之后,您可以将自动恢复行为设置为 disableddefault 配置不能为不受支持的实例类型启用简化的自动恢复。

Console
在实例启动时禁用简化自动恢复
  1. 通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/

  2. 在导航窗格中,选择 Instances(实例),然后选择 Launch instance(启动实例)。

  3. Advanced details(高级详细信息)部分,对于 Instance auto-recovery(实例自动恢复),请选择 Disabled(已禁用)。

  4. 根据需要配置剩余的实例启动设置,然后启动实例。

禁用正在运行或已停止实例的简化自动恢复
  1. 通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/

  2. 在导航窗格中,选择实例

  3. 请选择实例,然后依次选择 Actions(操作)、Instance settings(实例设置)、Change auto-recovery behavior(更改自动恢复行为)。

  4. 选择 Off(关闭),然后选择 Save(保存)

要将正在运行或已停止实例的自动恢复行为设置为 default
  1. 通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/

  2. 在导航窗格中,选择实例

  3. 请选择实例,然后依次选择 Actions(操作)、Instance settings(实例设置)、Change auto-recovery behavior(更改自动恢复行为)。

  4. 选择默认(开启),然后选择保存

Amazon CLI
在启动时禁用简化自动恢复

可以使用 run-instances 命令。

aws ec2 run-instances \ --image-id ami-1a2b3c4d \ --instance-type t2.micro \ --key-name MyKeyPair \ --maintenance-options AutoRecovery=Disabled \ [...]
禁用正在运行或已停止实例的简化自动恢复

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery disabled
要将正在运行或已停止实例的自动恢复行为设置为 default

使用 modify-instance-maintenance-options 命令。

aws ec2 modify-instance-maintenance-options \ --instance-id i-0abcdef1234567890 \ --auto-recovery default

排查简化的自动恢复失败

以下问题可能会导致使用简化的自动恢复对实例进行恢复失败:

  • 简化的自动恢复在 Amazon Health Dashboard 中的服务事件期间不起作用。您可能不会收到此类事件的恢复失败通知。要了解最新的服务可用性信息,请参阅服务运行状况页面。

  • 替换硬件的临时容量不足。

  • 该实例已达到每天的恢复尝试操作限制。如果自动恢复失败,并且确定硬件性能下降是初始系统状态检查失败的根本原因,那么您的实例随后可能会被停用。

如果尽管多次尝试恢复,但实例的系统状态检查失败仍然存在,请参阅对状态检查失败的实例进行故障排除以获取更多指导。