Elastic Fabric Adapter - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种具有操作系统旁路功能的网络设备,可与同一子网上的其他实例进行低延迟的网络通信。EFA通过 Libfabric 公开,并且可供使用消息传递接口 (MPI) 的应用程序使用。

要EFA与一起使用 Amazon ParallelCluster,请将该行enable_efa = true添加到该[queue]部分

要查看支持的EC2实例列表EFA,请参阅 Amazon Linux 实例EC2用户指南中的支持的实例类型

有关 enable_efa 设置的更多信息,请参阅 [queue] 部分中的 enable_efa

应使用集群置放群组来最大限度地减少实例之间的延迟。有关更多信息,请参阅placementplacement_group

有关更多信息,请参阅 Amazon EC2 用户指南中的弹性结构适配器以及使用弹性结构适配器扩展HPC工作负载和 Amazon ParallelClusterAmazon开源博客

注意

默认情况下,Ubuntu 启用分发 ptrace (过程跟踪)保护。从 Amazon ParallelCluster 2,6.0 开始,ptrace 保护已禁用,这样 Libfabric 才能正常运行。有关更多信息,请参阅《亚马逊EC2用户指南》中的禁用 ptrace 保护

注意

2.10.1 版本中增加了EFA对基于 ARM 的 Graviton2 实例的支持。 Amazon ParallelCluster