Elastic Fabric Adapter - Amazon Batch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Elastic Fabric Adapter

Elastic Fabric Adapter (EFA) 是一种用于加速高性能计算 (HPC) 应用程序的网络设备。如果满足以下条件,则 Amazon Batch 支持使用 EFA 的应用程序。

  • 有关支持 EFA 的实例类型列表,请参阅 Amazon EC2 用户指南中的支持的实例类型

    提示

    要在中查看支持 EFA 的实例类型列表 Amazon Web Services 区域,请运行以下命令。然后,交叉引用 Amazon Batch 控制台中返回的列表和可用实例类型列表。

    $ aws ec2 describe-instance-types --region us-east-1 --filters Name=network-info.efa-supported,Values=true --query "InstanceTypes[*].[InstanceType]" --output text | sort
  • 如需了解支持 EFA 的操作系统列表,请参阅支持的操作系统

  • AMI 加载了 EFA 驱动程序。

  • EFA 的安全组必须允许进出安全组本身的所有入站和出站流量。

  • 使用 EFA 的所有实例都必须位于同一集群置放群组中。

  • 作业定义必须包含devices成员,其hostPath设置为/dev/infiniband/uverbs0,以允许将 EFA 设备传递到容器。如果指定了containerPath,则它还必须设置为/dev/infiniband/uverbs0。如果设置了permissions,则它必须设置为READ | WRITE |。MKNOD

    对于多节点 parallel 作业和单节点容器作业,LinuxParameters成员的位置不同。以下示例显示了差异,但缺少必填值。

    例 多节点并行作业的示例
    { "jobDefinitionName": "EFA-MNP-JobDef", "type": "multinode", "nodeProperties": { ... "nodeRangeProperties": [ { ... "container": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", "containerPath": "/dev/infiniband/uverbs0", "permissions": [ "READ", "WRITE", "MKNOD" ] }, ], }, }, }, ], }, }
    例 单节点容器作业的示例
    { "jobDefinitionName": "EFA-Container-JobDef", "type": "container", ... "containerProperties": { ... "linuxParameters": { "devices": [ { "hostPath": "/dev/infiniband/uverbs0", }, ], }, }, }

有关 EFA 的更多信息,请参阅 Amazon EC2 用户指南中的弹性结构适配器