Elastic Fabric Adapter - Amazon Batch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种用于加速高性能计算 (HPC) 应用程序的网络设备。如果满足以下条件,则Amazon Batch支持使用 EFA 的应用程序。

  • 有关支持 EFA 的实例类型的列表,请参阅《Amazon EC2 用户指南(适用于 Linux 实例)》中的支持的实例类型

    提示

    要查看Amazon Web Services 区域中支持 EFA 的实例类型列表,请执行以下命令。然后,将返回的列表与Amazon Batch控制台中的可用实例类型列表进行交叉引用。

    $ aws ec2 describe-instance-types --region us-east-1 --filters Name=network-info.efa-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort
  • 如需了解支持 EFA 的操作系统列表,请参阅支持的操作系统

  • AMI 加载了 EFA 驱动程序。

  • EFA 的安全组必须允许进出安全组本身的所有入站和出站流量。

  • 使用 EFA 的所有实例都必须位于同一集群置放群组中。

  • 作业定义必须包含devices成员,其hostPath设置为/dev/infiniband/uverbs0,以允许将 EFA 设备传递到容器。如果指定了containerPath,则它还必须设置为/dev/infiniband/uverbs0。如果设置了permissions,则它必须设置为READ | WRITE |。MKNOD

    对于多节点并行作业和单节点容器作业,LinuxParameters 成员的位置将不同。以下示例显示了差异,但缺少必填值。

    例 多节点并行作业的示例
    { "jobDefinitionName": "EFA-MNP-JobDef", "type": "multinode", "nodeProperties": { ... "nodeRangeProperties": [ { ... "container": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", "containerPath": "/dev/infiniband/uverbs0", "permissions": [ "READ", "WRITE", "MKNOD" ] }, ], }, }, }, ], }, }
    例 单节点容器作业的示例
    { "jobDefinitionName": "EFA-Container-JobDef", "type": "container", ... "containerProperties": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", }, ], }, }, }

有关 EFA 更多信息,请参阅《适用于 Linux 实例的 Amazon EC2 用户指南》中Elastic Fabric Adapter