最佳实践 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

最佳实践

最佳实践:主实例类型选择

尽管主节点不执行任何作业,但其功能和规模对群集的整体性能至关重要。

选择用于主节点的实例类型时,您想要评估以下项目:

  • 集群大小:主节点负责编排群集的扩展逻辑,并负责将新节点附加到调度程序。如果你需要向上和向下扩展大量节点的集群,那么你想为主节点提供一些额外的计算容量。

  • 共享文件系统:使用共享文件系统在计算节点和主节点之间共享工件时,应考虑到主节点是公开 NFS 服务器的节点。因此,您想要选择具有足够网络带宽和足够专用 Amazon EBS 带宽来处理工作流程的实例类型。

最佳实践:网络性能

有三个提示涵盖了改善网络通信的所有可能性。

  • 置放群组:集群置放群组是单个可用区中的实例的逻辑分组。有关置放群组的更多信息,请参阅置放群组中的适用于 Linux 实例的 Amazon EC2 用户指南. 您可以将集群配置为使用自己的置放群组placement_group = your-placement-group-name或让Amazon ParallelCluster使用创建置放群组"compute"使用策略placement_group = DYNAMIC. 有关更多信息,请参阅 。placement_group对于多个队列模式和placement_group对于单个队列模式。

  • 增强联网:考虑选择支持增强联网的实例类型。有关更多信息,请参阅 。Linux 上的增强联网中的适用于 Linux 实例的 Amazon EC2 用户指南.

  • 实例带宽:带宽随实例大小而扩展,请考虑选择更适合您需求的实例类型,请参阅Amazon EBS 优化的实例Amazon EBS 卷类型中的适用于 Linux 实例的 Amazon EC2 用户指南.