在 Linux 实例上安装 NVIDIA 驱动程序 - Amazon Elastic Compute Cloud
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Linux 实例上安装 NVIDIA 驱动程序

已挂载 NVIDIA GPU 的实例(如 P3 或 G4dn 实例)必须安装相应的 NVIDIA 驱动程序。根据实例类型,您可以下载公有 NVIDIA 驱动程序、从仅对Amazon客户可用的 Amazon S3 下载驱动程序或者使用预安装了驱动程序的 AMI。

要在挂载 AMD GPU 的 Linux 实例(例如,G4ad 实例)上安装 AMD 驱动程序,则请参阅安装 AMD 驱动程序要在 Windows 实例上安装 NVIDIA 驱动程序,请参阅在 Windows 实例上安装 NVIDIA 驱动程序

NVIDIA 驱动程序的类型

以下是可与基于 GPU 的实例一起使用的 NVIDIA 驱动程序的主要类型。

Tesla 驱动程序

这些驱动程序主要用于将 GPU 用于计算任务的计算工作负载,例如适用于机器学习的并行浮点计算,以及适用于高性能计算应用的快速傅里叶变换。

GRID 驱动程序

这些驱动程序经过认证,可针对渲染 3D 模型或高分辨率视频等内容的专业可视化应用程序,提供最佳性能。您可以将 GRID 驱动程序配置为支持两种模式。Quadro 虚拟工作站的每个 GPU 可支持四个 4K 显示器。GRID vApps 提供 RDSH App 托管功能。

Gaming 驱动程序

这些驱动程序包含针对游戏的优化,并经常更新以提供性能增强。它们支持每个 GPU 单个 4K 显示器。

NVIDIA 控制面板

GRID 和游戏驱动程序支持 NVIDIA 控制面板。Tesla 驱动程序不支持此控制面板。

Tesla、GRID 和游戏驱动程序支持的 API
  • OpenCL、OpenGL 和 Vulkan

  • NVIDIA CUDA 和相关库(例如,cuDNN、TensorRT、nvJPEG 和 cuBLAS)

  • 用于视频编码的 NVENC 和用于视频解码的 NVDEC

按实例类型列出的可用驱动程序

下表总结了各种 GPU 实例类型支持的 NVIDIA 驱动程序。

实例类型 Tesla 驱动程序 GRID 驱动程序 Gaming 驱动程序
G2
G3
G4dn 支持
G5 支持
G5g 是¹
P2
P3
P4d
P4de

¹ 此 Tesla 驱动程序还支持特定于 ARM64 平台的优化图形应用程序

² 仅使用 Marketplace AMI

安装选项

使用以下选项之一获取 GPU 实例所需的 NVIDIA 驱动程序。

选项 1:安装了 NVIDIA 驱动程序的 AMI

Amazon 和 NVIDIA 随已安装的 NVIDIA 驱动程序提供了不同的亚马逊机器映像(AMI)。

要使用这些 AMI 之一更新已安装的驱动程序版本,您必须从实例中卸载 NVIDIA 软件包以避免版本冲突。使用此命令卸载 NVIDIA 软件包:

[ec2-user ~]$ sudo yum erase nvidia cuda

Amazon 提供的 CUDA 工具包安装包对 NVIDIA 驱动程序有依赖性。卸载 NVIDIA 软件包也会删除 CUDA 工具包。必须在安装 NVIDIA 驱动程序之后重新安装 CUDA 工具包。

选项 2:公共 NVIDIA 驱动程序

Amazon 提供的选项附带了驱动程序所需的许可证。或者,您可以安装公共驱动程序并自带许可证。要安装公共驱动程序,请按照此处的说明从 NVIDIA 站点下载该驱动程序。

或者,您可以使用 Amazon 提供的选项而非公有驱动程序。要在 P3 实例上使用 GRID 驱动程序,请按照选项 1中的说明使用 Amazon Web Services Marketplace AMI。要在 G5、G4dn 或 G3 实例上使用 GRID 驱动程序,请使用 Amazon Web Services Marketplace AMI(如选项 1 所述),或安装 Amazon 提供的 NVIDIA 驱动程序(如选项 3 中所述)。

下载公共 NVIDIA 驱动程序

登录您的 Linux 实例并从 http://www.nvidia.com/Download/Find.aspx 下载适合实例类型的 64 位 NVIDIA 驱动程序。对于产品类型产品系列产品,请使用下表中的选项。

实例 产品类型 产品系列 产品
G2 GRID GRID 系列 GRID K520
G3 Tesla M-Class M60
G4dn Tesla T 系列 T4
G5 ¹ Tesla A 系列 A10
G5g ² Tesla T 系列 NVIDIA T4G
P2 Tesla E 系列 K80
P3 Tesla V 系列 V100
P4d Tesla A 系列 A100
P4de Tesla A 系列 A100
P5 ³ Tesla H 系列 H100

¹ G5 实例需要驱动程序版本 470.00 或更高版本

² G5g 实例需要驱动程序版本 470.82.01 或更高版本。操作系统是 Linux aarch64

³ P5 实例需要驱动程序版本 530 或更高版本。

在 Linux 上安装 NVIDIA 驱动程序

有关安装和配置驱动程序的更多信息,请参阅 NVIDIA 驱动程序安装快速入门指南

选项 3:GRID 驱动程序(G5、G4dn 和 G3 实例)

这些下载仅供 Amazon 客户使用。一旦开始下载,即表示您同意按照 NVIDIA GRID 云终端用户许可协议(EULA)中提及的 Amazon 解决方案的要求,仅将下载的软件用来开发 AMI,以用于 NVIDIA A10G、NVIDIA Tesla T4 或 NVIDIA Tesla M60 硬件。安装软件后,您将受 NVIDIA GRID 云最终用户许可协议的条款约束。有关适用于您操作系统的 NVIDIA GRID 驱动程序版本的信息,请参阅 NVIDIA 网站上的 NVIDIA® 虚拟 GPU(vGPU)软件文档

注意事项
  • G5 实例需要 GRID 13.1 或更高版本(或 GRID 12.4 或更高版本)。

  • 要让 GRID 许可正常运行,G3 实例需要 Amazon 提供的 DNS 解析。

  • IMDSv2 仅在 14.0 或更高版本的 NVIDIA 驱动程序上受支持。

在实例上安装 NVIDIA GRID 驱动程序
  1. 连接到 Linux 实例。

  2. 在 Linux 实例上安装 Amazon CLI 并配置默认凭证。有关更多信息,请参阅 Amazon Command Line Interface 用户指南中的安装 Amazon CLI

    重要

    用户或角色必须具有包含 AmazonS3ReadOnlyAccess 策略的授予权限。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的 Amazon 托管式策略:AmazonS3ReadOnlyAccess

  3. 安装 gccmake(如果尚未安装)。

    [ec2-user ~]$ sudo yum install gcc make
  4. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  5. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  6. 重启之后重新连接到实例。

  7. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
  8. 使用以下命令下载 GRID 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ --region us-east-1 --no-sign-request
  9. 使用以下命令添加权限以运行驱动程序安装实用程序。

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  10. 如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run
    注意

    如果您使用的是具有 5.10 内核版本的 Amazon Linux 2,请使用以下命令安装 GRID 驱动程序。

    [ec2-user ~]$ sudo CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  11. 确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。

    [ec2-user ~]$ nvidia-smi -q | head
  12. 如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  13. 重启实例。

    [ec2-user ~]$ sudo reboot
  14. (可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。

    1. 为了帮助利用高达 4K 分辨率的四个显示器,请设置高性能显示协议 NICE DCV

    2. NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。

在实例上安装 NVIDIA GRID 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
  6. 禁用 NVIDIA 显卡的 nouveau 开源驱动程序。

    1. nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件。复制下面的代码块并将其粘贴到终端中。

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. 编辑 /etc/default/grub 文件并添加以下行:

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. 重新生成 Grub 配置。

      [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
  7. 使用以下命令下载 GRID 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ --region us-east-1 --no-sign-request
  8. 使用以下命令添加权限以运行驱动程序安装实用程序。

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  9. 如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  10. 确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。

    [ec2-user ~]$ nvidia-smi -q | head
  11. 如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  12. 重启实例。

    [ec2-user ~]$ sudo reboot
  13. (可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。

    1. 为了帮助利用高达 4K 分辨率的四个显示器,请设置高性能显示协议 NICE DCV

    2. NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。

    3. 安装 GUI 桌面/工作站程序包。

      [ec2-user ~]$ sudo yum groupinstall -y "Server with GUI"
在实例上安装 NVIDIA GRID 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo dnf install -y make gcc elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r)
  6. 使用以下命令下载 GRID 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ --region us-east-1 --no-sign-request
  7. 使用以下命令添加权限以运行驱动程序安装实用程序。

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  8. 如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  9. 确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。

    [ec2-user ~]$ nvidia-smi -q | head
  10. 如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  11. 重启实例。

    [ec2-user ~]$ sudo reboot
  12. (可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。

    1. 为了帮助利用高达 4K 分辨率的四个显示器,请设置高性能显示协议 NICE DCV

    2. NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。

    3. 安装 GUI 工作站程序包。

      [ec2-user ~]$ sudo dnf groupinstall -y workstation
在 Linux 实例上安装 NVIDIA GRID 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo dnf install -y make gcc elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r)
  6. 使用以下命令下载 GRID 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。

    [ec2-user ~]$ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ --region us-east-1 --no-sign-request
  7. 使用以下命令添加权限以运行驱动程序安装实用程序。

    [ec2-user ~]$ chmod +x NVIDIA-Linux-x86_64*.run
  8. 如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:

    [ec2-user ~]$ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  9. 确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。

    [ec2-user ~]$ nvidia-smi -q | head
  10. 如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  11. 重启实例。

    [ec2-user ~]$ sudo reboot
  12. (可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。

    1. 为了帮助利用高达 4K 分辨率的四个显示器,请设置高性能显示协议 NICE DCV

    2. NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。

在实例上安装 NVIDIA GRID 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    $ sudo apt-get update -y
  3. (Ubuntu)升级 linux-aws 程序包以接收最新版本。

    $ sudo apt-get upgrade -y linux-aws

    (Debian)升级程序包以接收最新版本。

    $ sudo apt-get upgrade -y
  4. 重启实例以加载最新内核版本。

    $ sudo reboot
  5. 重启之后重新连接到实例。

  6. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    $ sudo apt-get install -y gcc make linux-headers-$(uname -r)
  7. 禁用 NVIDIA 显卡的 nouveau 开源驱动程序。

    1. nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件。复制下面的代码块并将其粘贴到终端中。

      $ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. 编辑 /etc/default/grub 文件并添加以下行:

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. 重新生成 Grub 配置。

      $ sudo update-grub
  8. 使用以下命令下载 GRID 驱动程序安装实用程序:

    $ aws s3 cp --recursive s3://ec2-linux-nvidia-drivers/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的 GRID 驱动程序。您可以使用以下命令查看所有可用的版本。

    $ aws s3 ls --recursive s3://ec2-linux-nvidia-drivers/ --region us-east-1 --no-sign-request
  9. 使用以下命令添加权限以运行驱动程序安装实用程序。

    $ chmod +x NVIDIA-Linux-x86_64*.run
  10. 如下所示运行自安装脚本,安装您下载的 GRID 驱动程序。例如:

    $ sudo /bin/sh ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  11. 确认驱动程序正常运行。以下命令的响应列出已安装的 NVIDIA 驱动程序版本和有关 GPU 的详细信息。

    $ nvidia-smi -q | head
  12. 如果您在 G4dn、G5 或 G5g 实例上使用 NVIDIA vGPU 软件版本 14.x 或更高版本,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    $ sudo touch /etc/modprobe.d/nvidia.conf
    $ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  13. 重启实例。

    $ sudo reboot
  14. (可选)根据您的用例,您可能会完成以下可选步骤。如果您不需要此功能,请不要完成这些步骤。

    1. 为了帮助利用高达 4K 分辨率的四个显示器,请设置高性能显示协议 NICE DCV

    2. NVIDIA Quadro 虚拟工作站模式默认处于启用状态。要为 RDSH 应用程序托管功能激活 GRID 虚拟应用程序,请完成激活 NVIDIA GRID 虚拟应用程序中的 GRID 虚拟应用程序激活步骤。

    3. 安装 GUI 桌面/工作站程序包。

      $ sudo apt-get install -y lightdm ubuntu-desktop

选项 4:NVIDIA Gaming 驱动程序(G5 和 G4dn 实例)

这些驱动程序仅供 Amazon 客户使用。下载驱动程序即表明您同意仅使用下载的软件开发用于 NVIDIA A10G 和 NVIDIA Tesla T4 硬件的 AMI。安装软件后,您将受 NVIDIA GRID 云最终用户许可协议的条款约束。

注意事项
  • 要让 GRID 许可正常运行,G3 实例需要 Amazon 提供的 DNS 解析。

  • IMDSv2 仅在 495.x 或更高版本的 NVIDIA 驱动程序上受支持。

在实例上安装 NVIDIA Gaming 驱动程序
  1. 连接到 Linux 实例。

  2. 在 Linux 实例上安装 Amazon CLI 并配置默认凭证。有关更多信息,请参阅 Amazon Command Line Interface 用户指南中的安装 Amazon CLI

    重要

    用户或角色必须具有包含 AmazonS3ReadOnlyAccess 策略的授予权限。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的 Amazon 托管式策略:AmazonS3ReadOnlyAccess

  3. 安装 gccmake(如果尚未安装)。

    [ec2-user ~]$ sudo yum install gcc make
  4. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  5. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  6. 重启之后重新连接到实例。

  7. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo yum install -y gcc kernel-devel-$(uname -r)
  8. 使用以下命令下载 Gaming 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/ --region us-east-1 --no-sign-request
  9. 从下载的 .zip 归档中提取 Gaming 驱动程序安装实用程序。

    [ec2-user ~]$ unzip latest-driver-name.zip -d nvidia-drivers
  10. 使用以下命令添加权限以运行驱动程序安装实用程序:

    [ec2-user ~]$ chmod +x nvidia-drivers/NVIDIA-Linux-x86_64*-grid.run
  11. 使用以下命令运行安装程序:

    [ec2-user ~]$ sudo ./nvidia-drivers/NVIDIA-Linux-x86_64*.run
    注意

    如果您使用的是具有 5.10 内核版本的 Amazon Linux 2,请使用以下命令安装 NVIDIA 游戏驱动程序。

    [ec2-user ~]$ sudo CC=/usr/bin/gcc10-cc ./NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  12. 使用以下命令创建所需的配置文件。

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  13. 使用以下命令下载并重命名认证文件。

    • 对于 460.39 及更高版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2023_9_22.cert"
    • 对于 440.68 到 445.48 版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • 对于早期版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  14. 如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  15. 重启实例。

    [ec2-user ~]$ sudo reboot
  16. (可选)为了帮助利用高达 4K 分辨率的单个显示器,请设置高性能显示协议 NICE DCV

在实例上安装 NVIDIA Gaming 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo yum install -y unzip gcc kernel-devel-$(uname -r)
  6. 禁用 NVIDIA 显卡的 nouveau 开源驱动程序。

    1. nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件。复制下面的代码块并将其粘贴到终端中。

      [ec2-user ~]$ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. 编辑 /etc/default/grub 文件并添加以下行:

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. 重新生成 Grub 配置。

      [ec2-user ~]$ sudo grub2-mkconfig -o /boot/grub2/grub.cfg
  7. 使用以下命令下载 Gaming 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/ --region us-east-1 --no-sign-request
  8. 从下载的 .zip 归档中提取 Gaming 驱动程序安装实用程序。

    [ec2-user ~]$ unzip vGPUSW-*vGaming-Linux-Guest-Drivers.zip -d nvidia-drivers
  9. 使用以下命令添加权限以运行驱动程序安装实用程序:

    [ec2-user ~]$ chmod +x nvidia-drivers/Linux/NVIDIA-Linux-x86_64*-grid.run
  10. 使用以下命令运行安装程序:

    [ec2-user ~]$ sudo ./nvidia-drivers/Linux/NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  11. 使用以下命令创建所需的配置文件。

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  12. 使用以下命令下载并重命名认证文件。

    • 对于 460.39 及更高版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2023_9_22.cert"
    • 对于 440.68 到 445.48 版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • 对于早期版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  13. 如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  14. 重启实例。

    [ec2-user ~]$ sudo reboot
  15. (可选)为了帮助利用高达 4K 分辨率的单个显示器,请设置高性能显示协议 NICE DCV。如果您不需要此功能,请勿完成此步骤。

在实例上安装 NVIDIA Gaming 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo yum install -y unzip gcc kernel-devel-$(uname -r)
  6. 使用以下命令下载 Gaming 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/ --region us-east-1 --no-sign-request
  7. 从下载的 .zip 归档中提取 Gaming 驱动程序安装实用程序。

    [ec2-user ~]$ unzip vGPUSW-*vGaming-Linux-Guest-Drivers.zip -d nvidia-drivers
  8. 使用以下命令添加权限以运行驱动程序安装实用程序:

    [ec2-user ~]$ chmod +x nvidia-drivers/Linux/NVIDIA-Linux-x86_64*-grid.run
  9. 使用以下命令运行安装程序:

    [ec2-user ~]$ sudo ./nvidia-drivers/Linux/NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  10. 使用以下命令创建所需的配置文件。

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  11. 使用以下命令下载并重命名认证文件。

    • 对于 460.39 及更高版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2023_9_22.cert"
    • 对于 440.68 到 445.48 版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • 对于早期版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  12. 如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  13. 重启实例。

    [ec2-user ~]$ sudo reboot
  14. (可选)为了帮助利用高达 4K 分辨率的单个显示器,请设置高性能显示协议 NICE DCV

在实例上安装 NVIDIA Gaming 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    [ec2-user ~]$ sudo yum update -y
  3. 重启实例以加载最新内核版本。

    [ec2-user ~]$ sudo reboot
  4. 重启之后重新连接到实例。

  5. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    [ec2-user ~]$ sudo dnf install -y unzip gcc make elfutils-libelf-devel libglvnd-devel kernel-devel-$(uname -r)
  6. 使用以下命令下载 Gaming 驱动程序安装实用程序:

    [ec2-user ~]$ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:

    [ec2-user ~]$ aws s3 ls --recursive s3://nvidia-gaming/linux/ --region us-east-1 --no-sign-request
  7. 从下载的 .zip 归档中提取 Gaming 驱动程序安装实用程序。

    [ec2-user ~]$ unzip vGPUSW-*vGaming-Linux-Guest-Drivers.zip -d nvidia-drivers
  8. 使用以下命令添加权限以运行驱动程序安装实用程序:

    [ec2-user ~]$ chmod +x nvidia-drivers/Linux/NVIDIA-Linux-x86_64*-grid.run
  9. 使用以下命令运行安装程序:

    [ec2-user ~]$ sudo ./nvidia-drivers/Linux/NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  10. 使用以下命令创建所需的配置文件。

    [ec2-user ~]$ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  11. 使用以下命令下载并重命名认证文件。

    • 对于 460.39 及更高版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2023_9_22.cert"
    • 对于 440.68 到 445.48 版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • 对于早期版本:

      [ec2-user ~]$ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  12. 如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    [ec2-user ~]$ sudo touch /etc/modprobe.d/nvidia.conf
    [ec2-user ~]$ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  13. 重启实例。

    [ec2-user ~]$ sudo reboot
  14. (可选)为了帮助利用高达 4K 分辨率的单个显示器,请设置高性能显示协议 NICE DCV

在实例上安装 NVIDIA Gaming 驱动程序
  1. 连接到 Linux 实例。安装 gccmake(如果尚未安装)。

  2. 更新软件包缓存并获取实例软件包更新。

    $ sudo apt-get update -y
  3. 升级 linux-aws 程序包以接收最新版本。

    $ sudo apt-get upgrade -y linux-aws
  4. 重启实例以加载最新内核版本。

    $ sudo reboot
  5. 重启之后重新连接到实例。

  6. 为您当前运行的内核版本安装 gcc 编译器和内核标头软件包。

    $ sudo apt-get install -y unzip gcc make linux-headers-$(uname -r)
  7. 禁用 NVIDIA 显卡的 nouveau 开源驱动程序。

    1. nouveau 添加到 /etc/modprobe.d/blacklist.conf 黑名单文件。复制下面的代码块并将其粘贴到终端中。

      $ cat << EOF | sudo tee --append /etc/modprobe.d/blacklist.conf blacklist vga16fb blacklist nouveau blacklist rivafb blacklist nvidiafb blacklist rivatv EOF
    2. 编辑 /etc/default/grub 文件并添加以下行:

      GRUB_CMDLINE_LINUX="rdblacklist=nouveau"
    3. 重新生成 Grub 配置。

      $ sudo update-grub
  8. 使用以下命令下载 Gaming 驱动程序安装实用程序:

    $ aws s3 cp --recursive s3://nvidia-gaming/linux/latest/ . --region us-east-1 --no-sign-request

    此存储桶中存储了多个版本的游戏驱动程序。您可以使用以下命令查看所有可用的版本:

    $ aws s3 ls --recursive s3://nvidia-gaming/linux/ --region us-east-1 --no-sign-request
  9. 从下载的 .zip 归档中提取 Gaming 驱动程序安装实用程序。

    $ unzip vGPUSW-*vGaming-Linux-Guest-Drivers.zip -d nvidia-drivers
  10. 使用以下命令添加权限以运行驱动程序安装实用程序:

    $ chmod +x nvidia-drivers/Linux/NVIDIA-Linux-x86_64*-grid.run
  11. 使用以下命令运行安装程序:

    $ sudo ./nvidia-drivers/Linux/NVIDIA-Linux-x86_64*.run

    系统提示时,接受许可协议并根据需要指定安装选项 (您可以接受默认选项)。

  12. 使用以下命令创建所需的配置文件。

    $ cat << EOF | sudo tee -a /etc/nvidia/gridd.conf vGamingMarketplace=2 EOF
  13. 使用以下命令下载并重命名认证文件。

    • 对于 460.39 及更高版本:

      $ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCertLinux_2023_9_22.cert"
    • 对于 440.68 到 445.48 版本:

      $ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2020_04.cert"
    • 对于早期版本:

      $ sudo curl -o /etc/nvidia/GridSwCert.txt "https://nvidia-gaming.s3.amazonaws.com/GridSwCert-Archive/GridSwCert-Linux_2019_09.cert"
  14. 如果您在 G4dn、G5 或 G5g 实例上使用 510.x 或更高版本的 NVIDIA 驱动程序,请使用以下命令禁用 GSP。有关为什么需要这样做的更多信息,请访问 NVIDIA 文档

    $ sudo touch /etc/modprobe.d/nvidia.conf
    $ echo "options nvidia NVreg_EnableGpuFirmware=0" | sudo tee --append /etc/modprobe.d/nvidia.conf
  15. 重启实例。

    $ sudo reboot
  16. (可选)为了帮助利用高达 4K 分辨率的单个显示器,请设置高性能显示协议 NICE DCV。如果您不需要此功能,请勿完成此步骤。

安装 CUDA 的附加版本

在您的实例上安装 NVIDIA 图形驱动程序后,您可以安装与图形驱动程序捆绑的版本以外的 CUDA 版本。以下过程演示如何在实例上配置多个版本的 CUDA。

安装 CUDA 工具包
  1. 连接到 Linux 实例。

  2. 打开 NVIDIA 网站,然后选择所需的 CUDA 版本。

  3. 为您的实例上的操作系统选择架构、分发版和版本。对于安装程序类型,选择运行文件(本地)

  4. 按照说明下载安装脚本。

  5. 将运行权限添加到您使用以下命令下载的安装脚本。

    [ec2-user ~]$ chmod +x downloaded_installer_file
  6. 按如下方式运行安装脚本以安装 CUDA 工具包并将 CUDA 版本号添加到工具包路径中。

    [ec2-user ~]$ sudo sh downloaded_installer_file --silent --override --toolkit --samples --toolkitpath=/usr/local/cuda-version --samplespath=/usr/local/cuda --no-opengl-libs
  7. (可选)按如下方式设置默认 CUDA 版本。

    [ec2-user ~]$ sudo ln -s /usr/local/cuda-version /usr/local/cuda