

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 运行 SageMaker 训练作业
<a name="cluster-specific-configurations-run-sagemaker-training-job"></a>

SageMaker HyperPod 食谱支持提交 SageMaker 训练作业。在提交训练作业之前，必须更新集群配置 `sm_job.yaml`，并安装相应的环境。

## 把你的食谱当作 SageMaker 训练工作
<a name="cluster-specific-configurations-cluster-config-sm-job-yaml"></a>

如果您没有托管集群，则可以将您的配方用作 SageMaker 训练作业。您必须修改 SageMaker 训练作业配置文件才能运行您的配方。`sm_job.yaml`

```
sm_jobs_config:
  output_path: null 
  tensorboard_config:
    output_path: null 
    container_logs_path: null
  wait: True 
  inputs: 
    s3: 
      train: null
      val: null
    file_system:  
      directory_path: null
  additional_estimator_kwargs: 
    max_run: 1800
```

1. `output_path`：可以指定将模型保存到 Amazon S3 URL 的路径。

1. `tensorboard_config`：您可以指定 TensorBoard 相关配置，例如输出路径或 TensorBoard 日志路径。

1. `wait`：可以在提交训练作业时指定是否等待作业完成。

1. `inputs`：可以为训练和验证数据指定路径。数据源可以来自共享文件系统，例如 Amazon FSx 或 Amazon S3 网址。

1. `additional_estimator_kwargs`：用于向培训作业平台提交培训作业的其他估算器参数。 SageMaker 有关更多信息，请参阅[算法估算器](https://sagemaker.readthedocs.io/en/stable/api/training/algorithm.html)。