运行 MPI 作业 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

运行 MPI 作业

正如 SchedMD 中所建议的那样,使用引导 MPI 作业 Slurm 作为 MPI 引导方法。欲了解更多信息,请咨询官方 Slurm 您的 MPI 库的文档或官方文档。

例如,在 IntelMPI 官方文档中,您了解到在运行 StarCCM 作业时,必须设置 Slurm 通过导出环境变量作为流程协调器。I_MPI_HYDRA_BOOTSTRAP=slurm

注意

已知问题

如果您的 MPI 应用程序依赖于 SSH 作为生成 MPI 作业的机制,则 Slurm 中的已知错误可能会导致将目录用户名错误地解析为“nobody”。

要么配置要使用的应用程序 Slurm 作为 MPI 引导方法,或参阅 “故障排除” 部分,了解更多详细信息和可能的解决方法。用户名解析的已知问题