本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Slurm 配置 HyperPod 文件中管理哪些特定的配置
当您在上创建 Slurm 集群时 HyperPod, HyperPod 代理会根据您的集群创建请求slurm.conf
/opt/slurm/etc/
将和gres.conf
重要
我们强烈建议您不要更改这些由管理的参数 HyperPod。
-
在中
slurm.conf
, HyperPod 设置以下基本参数: ClusterName
SlurmctldHost
、PartitionName
、和NodeName
。此外,要启用该自动恢复功能, HyperPod 需要按以下方式设置
TaskPlugin
和SchedulerParameters
参数。默认情况下, HyperPod 代理将这两个参数设置为所需的值。TaskPlugin=task/none SchedulerParameters=permit_job_expansion
-
在中
gres.conf
, HyperPod 管理 G NodeName
PU 节点。