Amazon Elastic Compute Cloud
Linux 实例用户指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Linux加速计算实例

如果您需要高处理能力,您可以从使用加速计算实例中获益,这些实例可让您访问基于硬件的计算加速器,如图形处理单元 (GPU) 或现场可编程门阵列 (FPGA)。加速计算实例能在计算密集型工作负载上提供更高的并行度,以实现更高的吞吐量。

基于 GPU 的实例能让您访问具有数千个计算内核的 NVIDIA GPU。可以通过基于 GPU 的加速计算实例来利用 CUDA 或开放计算语言 (OpenCL) 并行计算框架,从而为科学、工程和渲染应用程序加速。还可以将这些实例用于图形应用程序,包括游戏流式处理、3-D 应用流式处理和其他图形工作负载。

基于 FPGA 的实例能让您访问具有数百万并行系统逻辑单元格的 FPGA。您可以通过基于 FPGA 的加速计算实例,利用定义自硬件加速来加速工作负载,例如基因组学、财务分析、实时视频处理、大数据分析和安全工作负载。您可以使用硬件描述语言 (如 Verilog 或 VHDL) 或使用更高级语言 (如 OpenCL 并行计算框架) 来开发这些加速。您可以开发自己的硬件加速代码或通过 AWS Marketplace 购买硬件加速。

重要

基于 FPGA 的实例不支持 Microsoft Windows。

您可以将加速计算实例放入集群置放群组中。集群置放群组可在单个可用区内实现实例间的低延迟和高带宽连接。有关更多信息,请参阅 置放群组

有关 Windows 加速计算实例的信息,请参阅 Amazon EC2 用户指南(适用于 Windows 实例) 中的Windows 加速计算实例

加速计算实例系列

加速计算实例系列使用硬件加速器或协处理器来执行一些功能,如浮点数计算、图形处理或数据模式匹配,比在 CPU 上运行的软件更有效。以下加速计算实例系列可供您在Amazon EC2中启动。

F1 实例

F1 实例使用 Xilinx UltraScale+ VU9P FPGA 并且专用于加快计算密集型算法,例如不适合通用型 CPU 的数据流或高度并行操作。F1 实例中的每个 FPGA 包含大约 250 万个逻辑单元和大约 6800 个数字信号处理 (DSP) 引擎,连同 64 GiB 的本地 DDR ECC 保护内存一起,通过专用 PCIe Gen3 x16 连接与实例相连。F1 实例提供本地 NVMe SSD 卷。

开发人员可以使用 FPGA 开发人员 AMI 和 AWS 硬件开发人员工具包来创建用于 F1 实例的自定义硬件加速。FPGA 人员开发 AMI 包括云中的用于全周期 FPGA 开发的开发工具。使用这些工具,开发人员可以创建和分享 Amazon FPGA 映像 (AFI),这些映像可以加载到 F1 实例的 FPGA 上。

有关更多信息,请参阅 Amazon EC2 F1 实例

P3 实例

P3 实例使用 NVIDIA Tesla V100 GPU,可用于使用 CUDA 或 OpenCL 编程模型或通过机器学习框架进行的通用 GPU 计算。P3 实例提供了高带宽网络、强大的半、单、双精度浮点功能以及每 GPU 16 GiB 内存,非常适合用于深度学习、计算流体动力学、计算金融、地震分析、分子建模、基因组学、渲染和其他服务器端 GPU 计算工作负载。Tesla V100 GPU 不支持图形模式。

P3 实例支持 NVIDIA NVLink 对等传输。

要查看有关系统的拓扑信息,请运行以下命令:

nvidia-smi topo -m

有关更多信息,请参阅 NVIDIA NVLink

P2 实例

P2 实例使用 NVIDIA Tesla GPU K80 和适用于使用 CUDA 和 OpenCL 编程模型的通用 GPU 计算设计。P2 实例提供了高带宽网络、强大的单双精度浮点功能以及每个 GPU 12 GiB 的内存,非常适合深度学习、图形数据库、高性能数据库、计算流体动力学、计算金融、地震分析、分子建模、基因组学、渲染和其他服务器端 GPU 计算工作负载。

P2 实例支持 NVIDIA GPUDirect 对等传输。

要查看有关系统的拓扑信息,请运行以下命令:

nvidia-smi topo -m

有关更多信息,请参阅 NVIDIA GPUDirect

G3 实例

G3 实例使用 NVIDIA Tesla M60 GPU,为使用 DirectX 或 OpenGL 的图形应用程序提供经济高效的高性能平台。G3 实例还提供 NVIDIA GRID 虚拟工作站功能 (如 4 个分辨率高达 4096x2160 的监视器) 以及 NVIDIA GRID 虚拟应用程序。G3 实例非常适合一些应用程序,例如,3D 可视化、图形密集型远程工作站、3D 渲染、视频编码、虚拟现实以及其他需要大量并行处理能力的服务器端图形工作负载。

G3 实例支持 NVIDIA GRID 虚拟工作站和 NVIDIA GRID 虚拟应用程序。要激活任一功能,请参阅激活 NVIDIA GRID 虚拟应用 (仅限 G3 实例)

硬件规格

以下是加速计算实例的硬件规格摘要。

实例类型 默认 vCPU 内存 (GiB)
p2.xlarge 4 61
p2.8xlarge 32 488
p2.16xlarge 64 732
p3.2xlarge 8 61
p3.8xlarge 32 244
p3.16xlarge 64 488
g3.4xlarge 16 122
g3.8xlarge 32 244
g3.16xlarge 64 488
f1.2xlarge 8 122
f1.16xlarge 64 976

有关每种 Amazon EC2 实例类型的硬件规格的更多信息,请参阅 Amazon EC2 实例类型

有关指定 CPU 选项的更多信息,请参阅优化 CPU 选项

实例性能

您可以执行几种 GPU 设置优化以实现 P2、P3 和 G3 实例的最佳性能。有关更多信息,请参阅 优化 GPU 设置 (P2、P3 和 G3 实例)

通过 EBS 优化的实例,您可以消除 Amazon EBS I/O 与 实例的其他网络流量之间的争用,从而使 EBS 卷持续获得高性能。默认情况下,F1、P3、P2 和 G3 实例进行了 EBS 优化,而不会产生额外的费用。有关更多信息,请参阅Amazon EBS 优化实例

g3.16xlargep2.16xlargep3.16xlargef1.16xlarge 实例类型提供了在 Linux 上控制处理器 C 状态和 P 状态的功能。C 状态控制当核心处理非活动状态时可以进入的睡眠级别,而 P 状态控制核心的所需性能 (以 CPU 频率的形式)。有关更多信息,请参阅 您的 EC2 实例的处理器状态控制

网络性能

您可以对受支持的实例类型启用增强联网功能。通过增强联网功能,您可以显著提高每秒数据包数 (PPS) 性能,降低网络抖动,并减少延迟。有关更多信息,请参阅 Linux 上的增强联网

使用 Elastic Network Adapter (ENA) 来增强网络的实例类型提供较高的每秒数据包数性能,并始终保持较低的延迟。大多数应用程序并非始终需要较高的网络性能,但较高的带宽有助于其发送或接收数据。使用 ENA 并且支持高达 10 Gbps 吞吐量的实例类型使用一种网络 I/O 积分机制,根据平均带宽利用率为不同实例分配网络带宽。实例在网络吞吐量低于其基准限制时会累积积分,并能够在执行网络数据传输时使用这些积分。对于需要持续访问 10 Gbps 带宽或以上的工作负载,建议使用支持 10 Gbps 或 25 Gbps 网络速度的实例类型。

以下是支持增强联网的加速计算实例的网络性能摘要。

实例类型 网络性能 增强联网

f1.2xlargeg3.4xlargep3.2xlarge

最高 10 Gbps

ENA

g3.8xlargep2.8xlargep3.8xlarge

10Gbps

ENA

f1.16xlargeg3.16.xlargeg3.16.xlargep2.16xlargep3.16xlarge

25Gbps

ENA

实例功能

加速计算实例的特性汇总如下。

仅限 VPC 仅限于 EBS 实例存储 置放群组

G3

P2

P3

F1

NVMe *

* 根设备卷必须是 Amazon EBS 卷。

有关更多信息,请参阅下列内容:

发行说明

适用于基于 GPU 的加速计算实例的 AMI

为了帮助您开始使用,NVIDIA 和其他公司为基于 GPU 的加速计算实例提供了 AMI。这些参考 AMI 包含 NVIDIA 驱动程序,可实现 NVIDIA GPU 的完整功能和性能。

有关包含 NVIDIA 驱动程序的 AMI 的列表,请搜索 AWS Marketplace,如下所示:

您可以使用任意 HVM AMI 启动加速计算实例。

重要

这些 AMI 包含由 NVIDIA Corporation 开发、拥有或提供的驱动程序、软件或工具包。使用这些 AMI 即表明您同意仅在包含 NVIDIA 硬件的 Amazon EC2 实例上使用这些 NVIDIA 驱动程序、软件或工具包。

您也可以手动安装 NVIDIA 驱动程序。有关更多信息,请参阅在 Linux 实例上安装 NVIDIA 驱动程序