View a markdown version of this page

运行 MPI 作业 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

运行 MPI 作业

请按照 SchedMD 中的建议,使用 Slurm 作为 MPI 引导方法来引导 MPI 作业。有关更多信息,请参阅官方 Slurm 文档或 MPI 库的官方文档。

例如,通过 IntelMPI 官方文档,您可知道在运行 StarCCM 作业时,必须通过导出环境变量 I_MPI_HYDRA_BOOTSTRAP=slurm,将 Slurm 设置为进程编排工具。

注意

已知问题

如果您的 MPI 应用程序依赖 SSH 作为生成 MPI 作业的机制,则可能会在 S lurm 中遇到一个已知错误,该错误会导致目录用户名的解析错误为 “nobody”。

请将您的应用程序配置为使用 Slurm 作为 MPI 引导方法,或者参阅“问题排查”一节中的用户名解析的已知问题以了解更多详细信息以及可能的解决方法。