如何使用分布式数据并行库运行 SageMaker分布式训练作业 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

如何使用分布式数据并行库运行 SageMaker分布式训练作业

SageMaker 分布式数据并行度 (SMDDP) 库专为便于使用和提供无缝集成而设计。 PyTorch

在启用 SMDDP 库的情况下训练深度学习模型时 SageMaker,您可以专注于编写训练脚本和模型训练。

首先,请导入 SMDDP 库以使用其经过优化的集合操作。 Amazon以下主题根据您要优化的集合操作提供有关在训练脚本中添加哪些内容的说明。