使用 SageMaker AI 分布式数据并行库进行分布式训练 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 SageMaker AI 分布式数据并行库进行分布式训练

SageMaker AI 分布式数据并行度 (SMDDP) 库专为易于使用和提供无缝集成而设计。 PyTorch

使用 SageMaker AI 上的 SMDDP 库训练深度学习模型时,您可以专注于编写训练脚本和模型训练。

要开始使用,请导入 SMDDP 库,以使用其针对 Amazon优化的集体操作。以下主题将根据您要优化的集体操作,说明应在训练脚本中添加哪些内容。