

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# SageMaker HyperPod 集群上的作业
<a name="sagemaker-hyperpod-run-jobs-slurm"></a>

以下主题提供了在已配置的 SageMaker HyperPod 集群上访问计算节点和运行机器学习工作负载的过程和示例。根据您在集群上设置环境的方式，有多种方法可以在 HyperPod 集 HyperPod 群上运行 ML 工作负载。[Awsome Distributed Training GitHub 存储库](https://github.com/aws-samples/awsome-distributed-training/)中还提供了在 HyperPod 集群上运行 ML 工作负载的示例。以下主题将引导您了解如何登录已配置的集 HyperPod 群并开始运行示例 ML 工作负载。

**提示**  
要查找实际示例和解决方案，另请参阅[SageMaker HyperPod研讨会](https://catalog.workshops.aws/sagemaker-hyperpod)。

**Topics**
+ [访问您的 SageMaker HyperPod 集群节点](sagemaker-hyperpod-run-jobs-slurm-access-nodes.md)
+ [在集群上调度 Slurm 作业 SageMaker HyperPod](sagemaker-hyperpod-run-jobs-slurm-schedule-slurm-job.md)
+ [在 Slurm 计算节点上运行 Docker 容器 HyperPod](sagemaker-hyperpod-run-jobs-slurm-docker.md)
+ [在 Slurm 开启的情况下运行分布式训练工作负载 HyperPod](sagemaker-hyperpod-run-jobs-slurm-distributed-training-workload.md)