使用 SageMaker的分布式模型并行库修改您的训练脚本 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SageMaker的分布式模型并行库修改您的训练脚本

使用此部分可了解如何使用 Amazon SageMaker 的特定于库的分布式模型并行 API 函数和参数来自定义您的训练脚本。我们建议您将本文档与模型并行库 API 文档一起使用。

这些部分中提供的训练脚本示例进行了简化,旨在重点介绍使用 库必须进行的必需更改。有关端到端的可运行笔记本示例,演示如何将 TensorFlow或 PyTorch训练脚本与SageMaker分布式模型并行库结合使用,请参阅分布式训练 Jupyter 笔记本示例