

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Slurm 配置 HyperPod 文件中管理哪些特定的配置
Slurm 配置文件

当您在上创建 Slurm 集群时 HyperPod， HyperPod 代理会根据您的集群创建请求[https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html)和生命周期脚本`/opt/slurm/etc/`将和[https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html)文件设置为管理 Slurm HyperPod 集群。以下列表显示了 HyperPod 代理处理和覆盖的特定参数。

**重要**  
我们强烈建议您**不要**更改这些由管理的参数 HyperPod。
+ 在中 [https://slurm.schedmd.com/slurm.conf.html](https://slurm.schedmd.com/slurm.conf.html)， HyperPod 设置以下基本参数：`ClusterName``SlurmctldHost`、`PartitionName`、和`NodeName`。

  此外，要启用该[自动节点恢复和自动恢复](sagemaker-hyperpod-resiliency-slurm-auto-resume.md)功能， HyperPod 需要按以下方式设置`TaskPlugin`和`SchedulerParameters`参数。默认情况下， HyperPod 代理将这两个参数设置为所需的值。

  ```
  TaskPlugin=task/none
  SchedulerParameters=permit_job_expansion
  ```
+ 在中 [https://slurm.schedmd.com/gres.conf.html](https://slurm.schedmd.com/gres.conf.html)， HyperPod 管理 G `NodeName` PU 节点。