亚马逊 EC2 点播或 Amazon EC2 Spot - Amazon Batch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 EC2 点播或 Amazon EC2 Spot

大多数 Amazon Batch 客户之所以使用 Amazon EC2 Spot 实例,是因为与按需实例相比,可以节省开支。但是,如果您的工作负载运行多个小时且无法中断,则按需型实例可能更适合您。您可以随时先试用竞价型实例,必要时切换到按需型实例。

如果您有以下要求和期望,请使用 Amazon EC2 按需实例:

  • 作业的运行时超过一个小时,您不能容忍工作负载中断。

  • 您的总体工作负载有严格的 SLO(服务级别目标),并且不能增加计算时间。

  • 您需要的实例更有可能出现中断。

如果您有以下要求和期望,请使用 Amazon EC2 竞价型实例:

  • 作业的运行时通常为 30 分钟或更短。

  • 您可以容忍潜在的中断,以及作业重新安排作为工作负载的一部分。有关更多信息,请参阅竞价型实例

  • 如果中断,可以从检查点重新启动长时间运行的作业。

您可以混合使用两种购买模式,方法是先在竞价型实例上提交,然后使用按需型实例作为后备选项。例如,在与 Amazon EC2 Spot 实例上运行的计算环境相连的队列上提交您的任务。如果任务被中断,请从 Amazon EventBridge 捕获事件并将其与竞价型实例回收相关联。然后,使用 Amazon Lambda 函数或 Amazon Step Functions将任务重新提交到按需队列。有关更多信息教程:针对作业失败事件发送 Amazon Simple Notification Service 警报,请参阅处理亚马逊 EC2 竞价型实例中断的最佳实践Amazon Batch 使用 Step Functions 进行管理

重要

为您的按需计算环境使用不同的实例类型、大小和可用区,以维持 Amazon EC2 Spot 实例池的可用性并降低中断率。