AWS Batch
用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

自动作业重试

您可以将重试策略应用于作业和作业定义,这将允许失败的作业自动重试。可能的失败情况包括:

  • 来自容器作业的任何非零退出代码

  • Amazon EC2 实例失败或终止

  • 内部 AWS 服务出错或中断

在将作业提交到作业队列并置于 RUNNING 状态时,将视为一次尝试。默认情况下,每个作业均可尝试移至 SUCCEEDEDFAILED 作业状态一次。不过,作业定义和作业提交工作流都允许您指定一个具有 1 至 10 次尝试的重试策略。有关更多信息,请参阅 重试策略

在运行时,AWS_BATCH_JOB_ATTEMPT 环境变量将设置为容器的相应作业尝试次数。第一次尝试的编号为 1,后续尝试的编号按升序排列 (2、3、4,以此类推)。

如果作业尝试因任何原因失败,并且重试配置中指定的尝试次数大于 AWS_BATCH_JOB_ATTEMPT 数,则会再次将作业置于 RUNNABLE 状态。有关更多信息,请参阅作业状态

注意

不会重试已取消或终止的作业。此外,也不会重试因作业定义无效而导致失败的作业。

有关更多信息,请参阅 创建作业定义提交作业