本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
最佳实践
最佳实践:头节点实例类型选择
尽管头节点没有运行任何作业,但其功能和规模对于集群的整体性能至关重要。选择用于头节点的实例类型时,您想要评估以下项目:
集群大小:头节点负责编排群集的扩展逻辑,并负责将新节点附加到调度程序。如果你需要向上和向下扩展大量节点的集群,那么你想为头节点提供一些额外的计算容量。
共享文件系统:当使用共享文件系统在计算节点和头节点之间共享工件时,请考虑头节点是暴露 NFS 服务器的节点。因此,您想要选择具有足够网络带宽和足够专用 Amazon EBS 带宽来处理工作流程的实例类型。
最佳实践:网络性能
对于确保高性能计算 (HPC) 应用程序按预期运行,网络性能至关重要。我们推荐这三种最佳做法来优化网络性能。
-
置放群组:集群置放群组是单个可用区中的实例的逻辑分组。有关置放群组的更多信息,请参阅置放群组中的适用于 Linux 实例的 Amazon EC2 用户指南. 如果您正在使用Slurm,你可以配置每个Slurm队列来使用集群置放群组,方法是指定
PlacementGroup
在队列中Networking设置。Networking: PlacementGroup: Enabled: true Id: your-placement-group-name
或者让我们Amazon ParallelCluster使用以下命令创建置放群组:
Networking: PlacementGroup: Enabled: true
有关更多信息,请参阅 Networking。
-
增强联网:考虑选择支持增强联网的实例类型。这适用于所有最新一代实例. 有关更多信息,请参阅 。在 Linux 上增强联网中的适用于 Linux 实例的 Amazon EC2 用户指南.
-
实例带宽:带宽随实例大小而扩展,请考虑选择更适合您需求的实例类型,请参阅Amazon EBS 优化的实例和Amazon EBS 卷类型中的适用于 Linux 实例的 Amazon EC2 用户指南.