使用分布式数据并行库进行 SageMaker分布式训练 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用分布式数据并行库进行 SageMaker分布式训练

SageMaker 分布式数据并行度 (SMDDP) 库旨在便于使用并提供与的无缝集成。 PyTorch

在开启SMDDP库的情况下训练深度学习模型时 SageMaker,您可以专注于编写训练脚本和模型训练。

首先,请导入SMDDP库以使用其经过优化的集体操作 Amazon。以下主题根据您要优化的集合操作提供有关在训练脚本中添加哪些内容的说明。