Elastic Fabric Adapter - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种网络设备,具有操作系统旁路功能,可与同一子网上的其他实例进行低延迟的网络通信。EFA 通过使用 Libfabric 进行公开,并且可以由使用消息传递接口 (MPI) 的应用程序使用。

要将 EFA 与配合使用 Amazon ParallelCluster,请将该行enable_efa = true添加到该[queue]部分

要查看支持 EFA 的 EC2 实例的列表,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的支持的实例类型

有关 enable_efa 设置的更多信息,请参阅 [queue] 部分中的 enable_efa

应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅 placementplacement_group

有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的 Elastic Fabric Adapter 以及 Amazon 开放源代码博客 中的使用 Elastic Fabric Adapter 和 Amazon ParallelCluster扩展 HPC 工作负载

注意

默认情况下,Ubuntu 分发启用 ptrace(进程跟踪)保护。从 Amazon ParallelCluster 2.6.0 开始,将禁用 ptrace 保护以使 Libfabric 能够正常运行。有关更多信息,请参阅 Amazon EC2 用户指南(适用于 Linux 实例)中的禁用 ptrace 保护

注意

在 2.10.1 版本中增加了在基于 ARM 的 Graviton2 实例上支持 EFA。 Amazon ParallelCluster