暂停和恢复 Amazon EC2 Auto Scaling 流程 - Amazon EC2 Auto Scaling
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

暂停和恢复 Amazon EC2 Auto Scaling 流程

本主题介绍如何暂停然后恢复您的 Auto Scaling 组的一个或多个进程,以暂时禁用某些操作。

当您需要在不受扩展策略或计划操作干扰的情况下调查或解决问题时,暂停进程会很有用。它还有助于防止 Amazon EC2 Auto Scaling 在您对 Auto Scaling 组进行更改时将实例标记为运行状况不佳并替换它们。

注意

除在启动时暂停外,Amazon EC2 Auto Scaling 也可以暂停多次启动实例失败的 Auto Scaling 组。这称为管理暂停。管理暂停最常用于符合以下条件的 Auto Scaling 组:连续尝试启动实例的时间超过 24 小时,但是未成功启动任何实例。您可以恢复由于管理原因被 Amazon EC2 Auto Scaling 暂停的进程。

进程的类型

暂停-恢复功能支持以下进程:

  • Launch— 在 Auto Scaling 组扩展时,或者当 Amazon EC2 Auto Scaling 出于其他原因(例如向温池中添加实例时)选择启动实例时,将实例添加到 Auto Scaling 组。

  • Terminate— 当 Auto Scaling 组缩小规模,或者 Amazon EC2 Auto Scaling 出于其他原因选择终止实例时,例如当实例因超过其最大生命周期或未通过运行状况检查而终止实例时,从 Auto Scaling 组中移除实例。

  • AddToLoadBalancer— 启动时将实例添加到附加的负载均衡器目标组或 Classic Load Balancer。有关更多信息,请参阅 使用 Elastic Load Balancing 跨 Auto Scaling 组中的实例分配流量。

  • AlarmNotification— 接受来自与动态扩展策略关联的 CloudWatch警报的通知。有关更多信息,请参阅 Amazon EC2 Auto Scaling 的动态扩缩

  • AZRebalance— 当组变得不平衡时(例如,当以前不可用的可用区恢复到正常状态时),在所有指定的可用区之间均匀地平衡该组中的 EC2 实例数量。有关更多信息,请参阅 再平衡活动

  • HealthCheck— 如果 Amazon EC2 或 Elastic Load Balancing 告诉 Amazon EC2 Auto Scaling 该实例运行状况不佳,则检查该实例的运行状况并将该实例标记为运行状况不佳。此流程可覆盖您手动设置的实例运行状况状态。有关更多信息,请参阅 自动扩缩组中实例的运行状况检查

  • InstanceRefresh— 使用实例刷新功能终止和替换实例。有关更多信息,请参阅 使用实例刷新来更新 Auto Scaling 组中的实例

  • ReplaceUnhealthy— 终止标记为运行状况不佳的实例,然后创建新的实例来替换它们。有关更多信息,请参阅 自动扩缩组中实例的运行状况检查

  • ScheduledActions— 执行您创建或在创建扩展计划并开启预测性 Amazon Auto Scaling 扩展时为您创建的计划扩展操作。有关更多信息,请参阅 Amazon EC2 Auto Scaling 的计划扩缩

注意事项

暂停进程之前,请注意以下事项:

  • 暂停AlarmNotification允许您暂时停止群组的目标跟踪、步骤和简单扩展策略,而无需删除扩展策略或其关联 CloudWatch 警报。要暂时停止单个扩缩策略,请参阅禁用 Auto Scaling 组的扩缩策略

  • 您可以选择暂停HealthCheckReplaceUnhealthy进程以重启实例,而不会让 Amazon EC2 Auto Scaling 根据其运行状况检查终止实例。但是,如果您需要 Amazon EC2 Auto Scaling 继续对剩余实例执行运行状况检查,请改用备用功能。有关更多信息,请参阅 临时从 Auto Scaling 组中移除实例

  • 如果您暂停了 LaunchTerminate 进程或者 AZRebalance,并且随后对自动扩缩组进行了更改(例如,分离实例或更改指定的可用区),则您的组可能会在可用区之间失去均衡。如果出现这种情况,在您恢复暂停的流程后,Amazon EC2 Auto Scaling 将逐步在可用区之间均匀地重新分配实例。

  • 如果您暂停该Terminate进程,您仍然可以使用带有强制删除选项的delete-auto-scaling-group命令来强制终止实例。

  • 暂停该Terminate进程仅适用于当前处于该InService状态的实例。它不会阻止处于其他状态的实例终止Pending,例如或无法从待机状态正常恢复的实例。

  • 如果该RemoveFromLoadBalancerLowPriority过程出现在使用 Amazon CLI 或软件开发工具包描述 Auto Scaling 组的调用中,则可以将其忽略。此过程已过时,保留此过程仅是为了向后兼容。

暂停进程

要暂停 Auto Scaling 组的进程,请使用以下方法之一:

Console
暂停一个流程
  1. 访问 https://console.aws.amazon.com/ec2/,打开 Amazon EC2 控制台,然后从导航窗格中选择 Auto Scaling Groups(Auto Scaling 组)。

  2. 选中 Auto Scaling 组旁边的复选框。

    这时将在页面底部打开一个拆分窗格。

  3. Details(详细信息)选项卡上,选择 Advanced configurations(高级配置)、Edit(编辑)。

  4. 对于 Suspended processes(暂停的进程),选择要暂停的进程。

  5. 选择更新

Amazon CLI

使用下面的 suspend-processes 命令暂停单个进程。

aws autoscaling suspend-processes --auto-scaling-group-name my-asg --scaling-processes HealthCheck ReplaceUnhealthy

要暂停所有进程,请忽略 --scaling-processes 选项,如下所示。

aws autoscaling suspend-processes --auto-scaling-group-name my-asg

恢复流程

要恢复 Auto Scaling 组暂停的进程,请使用以下方法之一:

Console
恢复一个暂停的流程
  1. 访问 https://console.aws.amazon.com/ec2/,打开 Amazon EC2 控制台,然后从导航窗格中选择 Auto Scaling Groups(Auto Scaling 组)。

  2. 选中 Auto Scaling 组旁边的复选框。

    这时将在页面底部打开一个拆分窗格。

  3. Details(详细信息)选项卡上,选择 Advanced configurations(高级配置)、Edit(编辑)。

  4. 对于 Suspended processes(已暂停的进程),移除该已暂停的进程。

  5. 选择更新

Amazon CLI

要恢复暂停的进程,请使用以下 r esume-processes 命令

aws autoscaling resume-processes --auto-scaling-group-name my-asg --scaling-processes HealthCheck

要恢复所有已暂停的进程,请忽略 --scaling-processes 选项,如下所示。

aws autoscaling resume-processes --auto-scaling-group-name my-asg

暂停的进程如何影响其他进程

以下各节描述了当不同的进程单独暂停时会发生什么。

Launch已暂停

  • AlarmNotification 仍处于活动状态,但是您的自动扩缩组无法为超限警报启动横向扩展活动。

  • ScheduledActions 处于活动状态,但是您的自动扩缩组无法为出现的任何计划操作启动横向扩展活动。

  • AZRebalance 停止对组进行重新平衡。

  • ReplaceUnhealthy 继续终止运行不正常的实例,但不启动替换实例。Launch 过程恢复后,Amazon EC2 Auto Scaling 会立即替换它在 Launch 被暂停期间终止的所有实例。

  • InstanceRefresh 不会替换实例。

Terminate已暂停

  • AlarmNotification 仍处于活动状态,但是您的自动扩缩组无法为超限警报启动横向缩减活动。

  • ScheduledActions 处于活动状态,但是您的自动扩缩组无法为出现的任何计划操作启动横向缩减活动。

  • AZRebalance 仍处于活动状态,但不能正常运行。它可以启动新实例而不终止旧实例。这可能导致您的 Auto Scaling 组增加到比最大大小超出百分之十,因为在重新平衡活动期间允许短时间内发生这种情况。您的 Auto Scaling 组可以保持超出其最大大小,直到您恢复 Terminate 进程。

  • ReplaceUnhealthy 处于非活动状态但未 HealthCheck。当 Terminate 恢复后,ReplaceUnhealthy 进程将立即开始运行。如果任何实例在 Terminate 暂停期间被标记为运行状况不佳,将立即替换它们。

  • InstanceRefresh 不会替换实例。

AddToLoadBalancer已暂停

  • Amazon EC2 Auto Scaling 会启动实例,但不会将实例添加到负载均衡器目标组或经典负载均衡器。在您恢复 AddToLoadBalancer 进程后,该进程也会在启动实例时将其添加到负载均衡器。不过,它不会添加在此流程暂停时启动的实例。您必须手动注册这些实例。

AlarmNotification已暂停

  • 当 CloudWatch 警报阈值被违反时,Amazon EC2 Auto Scaling 不会调用扩展策略。当您恢复 AlarmNotification 时,Amazon EC2 Auto Scaling 考虑具有当前违反的警报阈值的策略。

AZRebalance已暂停

  • Amazon EC2 Auto Scaling 不会在某些事件发生后尝试重新分配实例。如果发生扩展或缩减事件,扩展进程仍会尝试均衡可用区。例如,在扩展期间,它会在实例最少的可用区中启动实例。如果组变得不平衡,同时 AZRebalance 处于暂停状态并且您恢复它,Amazon EC2 Auto Scaling 会尝试重新平衡组。它先调用 Launch,然后调用 Terminate

HealthCheck已暂停

  • Amazon EC2 Auto Scaling 停止在 EC2 和 Elastic Load Balancing 运行状况检查后将实例标记为运行状况不佳。您的自定义运行状况检查会继续正常运行。当您暂停 HealthCheck 后,在需要时可以手动设置组中实例的运行状况,并由 ReplaceUnhealthy 替换它们。

InstanceRefresh已暂停

  • Amazon EC2 Auto Scaling 停止因实例刷新而替换实例。如果正在刷新实例,则会暂停操作而不将其取消。

ReplaceUnhealthy已暂停

  • Amazon EC2 Auto Scaling 停止替换标记为运行状况不佳的实例。未通过 EC2 或 Elastic Load Balancing 运行状况检查的实例仍会被标记为运行状况不佳。一旦您恢复 ReplaceUnhealthy 进程,Amazon EC2 Auto Scaling 会替换在此进程暂停时标记为运行状况不佳的实例。ReplaceUnhealthy 进程会首先调用 Terminate,然后调用 Launch

ScheduledActions已暂停

  • Amazon EC2 Auto Scaling 不会运行计划在暂停期间运行的计划操作。当您恢复 ScheduledActions 后,Amazon EC2 Auto Scaling 仅考虑其计划时间尚未过期的计划操作。

其它注意事项

此外,在暂停 LaunchTerminate 时,以下功能可能无法正常运行:

  • 最长实例生命周期 — 当LaunchTerminate处于暂停状态时,最长实例生命周期功能无法取代任何实例。

  • 竞价型实例中断 — 如果已暂停并且您Terminate的 Auto Scaling 组有竞价型实例,则在竞价型容量不再可用时,它们仍然可以终止。暂停 Launch 时,Amazon EC2 Auto Scaling 无法从其他竞价型实例池启动替换实例,也无法在同一竞价型实例池再次可用时启动替换实例。

  • 容量再平衡 — 如果已暂停Terminate并且您使用容量再平衡来处理竞价型实例中断,则在竞价型容量不再可用时,Amazon EC2 竞价服务仍可以终止实例。如果暂停 Launch,Amazon EC2 Auto Scaling 无法从其他竞价型实例池启动替换实例,也无法在同一竞价型实例池再次可用时启动替换实例。

  • 连接和分离实例-当LaunchTerminate处于暂停状态时,您可以分离附加到 Auto Scaling 组的实例,但在暂停期间Launch,您无法将新实例附加到该组。

  • 备用实例 — 当LaunchTerminate处于暂停状态时,您可以将实例置于Standby状态,但是当实例Launch处于暂停状态时,您无法将处于该Standby状态的实例恢复服务。