AWS::SageMaker::MonitoringSchedule StoppingCondition - AWS CloudFormation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

AWS::SageMaker::MonitoringSchedule StoppingCondition

指定模型训练或编译作业可以运行的时间限制。它还指定您愿意等待托管的 Spot 训练作业完成的时间。当作业达到时间限制时,Amazon SageMaker 将结束训练或编译任务。使用此 API 来限制模型训练成本。

要停止作业,Amazon SageMaker 向算法发送 SIGTERM 信号,这会将作业终止延迟 120 秒。算法可以使用这一 120 秒的时段来保存模型构件,因此训练的结果不会丢失。

Amazon SageMaker 提供的训练算法尽可能自动保存模型训练作业的中间结果。这种保存构件的尝试只是最大努力的情况,因为模型可能未处于可以保存它的状态。例如,如果训练刚刚开始,则模型可能无法保存。保存时,此中间数据是有效的模型构件。您可以使用它来通过 CreateModel 创建模型。

注意

神经主题模型 (NTM) 目前不支持保存中间模型构件。训练 NTM 时,请确保最大运行时间足以完成训练作业。

语法

要在 AWS CloudFormation 模板中声明此实体,请使用以下语法:

JSON

{ "MaxRuntimeInSeconds" : Integer }

YAML

MaxRuntimeInSeconds: Integer

属性

MaxRuntimeInSeconds

训练或编译作业可以运行的最长时间(以秒为单位)。如果任务在此期间未完成,Amazon SageMaker 将结束该作业。如果未指定值,则默认值为 1 天。最大值为 28 天。

必需:是

类型:整数

最低1

Update requires: No interruption