第 1 步:使用 SageMaker 的分布式模型并行库修改自己的训练脚本 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 1 步:使用 SageMaker 的分布式模型并行库修改自己的训练脚本

使用此部分可以了解如何自定义您的训练脚本以使用亚马逊的核心功能。 SageMaker 分布式模型 parallel 库。要使用库特定的 API 函数和参数,我们建议您将本文档与SageMaker 模型 parallel 库 API中的SageMaker Python 开发工具包.

这些部分中提供的训练脚本示例经过简化,旨在突出显示使用库所需的更改。对于演示如何使用可运行的端到端笔记本示例 TensorFlow 要么 PyTorch 使用 SageMaker 分布式模型 parallel 库,请参阅亚马逊 SageMaker 分布式训练记本示例.