本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Elastic Fabric Adapter
Elastic Fabric Adapter (EFA) 是一种网络设备,具有操作系统旁路功能,可与同一子网上的其他实例进行低延迟的网络通信。EFA 通过使用 Libfabric 进行公开,并且可以由使用消息传递接口 (MPI) 的应用程序使用。
要将 EFA 与配合使用 Amazon ParallelCluster,请将该行enable_efa = true
添加到该[queue]部分。
要查看支持 EFA 的 EC2 实例的列表,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的支持的实例类型。
有关 enable_efa
设置的更多信息,请参阅 [queue] 部分中的 enable_efa。
应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placement 和 placement_group。
有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的 Elastic Fabric Adapter 以及 Amazon 开放源代码博客 中的使用 Elastic Fabric Adapter 和 Amazon ParallelCluster扩展 HPC 工作负载
注意
默认情况下,Ubuntu 分发启用 ptrace(进程跟踪)保护。从 Amazon ParallelCluster 2.6.0 开始,将禁用 ptrace 保护以使 Libfabric 能够正常运行。有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的禁用 ptrace 保护。
注意
在 2.10.1 版本中增加了在基于 ARM 的 Graviton2 实例上支持 EFA。 Amazon ParallelCluster