Amazon 深度学习 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) - Amazon Deep Learning AMIs
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon 深度学习 AMI GPU TensorFlow 2.16 (Ubuntu 20.04)

如需入门帮助,请参阅DLAMI 入门

AMI 名称格式

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) $ {YYYY-MM-DD}

  • 深度学习 OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Ubuntu 20.04) $ {YYYY-MM-DD}

支持的 EC2 实例

  • 请参阅 DLAMI 的重要变更

  • 使用 OSS 进行深度学习 Nvidia Driver 支持 G4dn、G5、G6、Gr6、G6e、p4d、p4de、P5、p5e、p5e、p5eN。

  • 使用专有 Nvidia 驱动程序进行深度学习支持 G3(不支持 G3.16x)、P3、p3dn

AMI 包括以下内容:

  • 支持的 Amazon 服务: EC2

  • 操作系统:Ubuntu 20.04

  • 计算架构:x86

  • Python:/opt/tensorflow/bin/python3.10

  • TensorFlow 版本:2.16

  • 英伟达驱动程序

    • OSS Nvidia 驱动程序:550.144.03

    • Nvidia 专有驱动程序:550.144.03

  • 英伟达 CUDA12 堆栈

    • CUDA、NCCL 和 cudDN 安装路径:/-12.3/ usr/local/cuda

  • EFA 安装程序:1.34.0

  • Amazon CLI v2 是 aws2,v1 是 aws Amazon CLI

  • EBS 卷类型:gp3

  • 使用 SSM 参数查询 AMI-ID(示例区域为 us-east-1):

    • OSS 英伟达驱动程序

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/oss-nvidia-driver-gpu-tensorflow-2.16-ubuntu-20.04/latest/ami-id --region us-east-1 --region us-east-1 --query "Parameter.Value" --output text
    • 专有的英伟达驱动程序

      aws ssm get-parameter --name /aws/service/deeplearning/ami/x86_64/proprietary-nvidia-driver-gpu-tensorflow-2.16-ubuntu-20.04/latest/ami-id --region us-east-1 --region us-east-1 --query "Parameter.Value" --output text
  • 使用以下方式查询 AMI-ID AWSCLI (示例区域为 us-east-1):

    • OSS 英伟达驱动程序

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Ubuntu 20.04) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text
    • 专有的英伟达驱动程序

      aws ec2 describe-images --region us-east-1 --owners amazon --filters 'Name=name,Values=Deep Learning Proprietary Nvidia Driver AMI GPU TensorFlow 2.16 (Ubuntu 20.04) ????????' 'Name=state,Values=available' --query 'reverse(sort_by(Images, &CreationDate))[:1].ImageId' --output text

Notice

Keras 版本固定为 2.0 而不是 3.0

在最新的 TF2 .16 版本中,Keras 已从主版本 2 升级到主版本 3.0。此 Keras 版本完全重写了 Keras 软件包(有关更多信息,请参阅 Keras 3 文档)。为了确保与客户工作流程的兼容性,我们使用环境变量 TF_USE_LEGACY_KERAS=1 将 Keras 版本固定为 2.0。如果您的工作流程需要使用 Keras 3.0,请使用以下脚本从您的 TensorFlow 虚拟环境 /opt/tensorflow 中移除此环境变量:

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS

发布日期:2025-02-17

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20250215

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20250215

已更新
已删除

发布日期:2025-01-20

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20250118

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20250118

已更新

发布日期:2024-10-22

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20241022

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20241022

已更新

发布日期:2024-10-04

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20241004

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240920

已更新

发布日期:2024-09-20

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240920

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240920

已更新
  • 将 Nvidia 驱动程序和 Fabric Manager 从 535.183.01 版升级到 550.90.07 版

  • 将 EFA 版本从 1.32.0 升级到 1.34.0

  • 将 PyTorch 版本从版本 2.3.0 更新到 2.3.1

新增了
  • 在 OSS Nvidia 驱动程序映像上添加了对 P5e EC2 实例的支持。

发布日期:2024-08-19

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240816

新增了

版本 2.16.2-发布日期:2024-07-25

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240725

已更新
  • 将 TensorFlow 补丁版本从版本 2.16.1 更新到 2.16.2

  • 已解决 TensorFlow 次要版本从 2.16 升级到 2.17 的问题

    • 深度学习 OSS Nvidia Driver AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240717 版本无意中包含次要版本 2.17 而不是 2.16。 TensorFlow 请确保依赖于 TensorFlow 2.16 的工作流程正在升级到最新的 DLAMI。

版本 2.16.1-发布日期:2024-06-06

AMI 的名字:

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240606

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 20240606

已更新
  • 将 Nvidia 驱动程序版本从 535.161.08 更新到 535.183.01

发布日期:2024-05-10

AMI 的名字:

请参阅 DLAMI 的重要变更

  • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) <>

  • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) <>

新增了
  • 的初始版本:

    • 深度学习专有 Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 系列。

    • 深度学习 OSS Nvidia 驱动程序 AMI GPU TensorFlow 2.16 (Ubuntu 20.04) 系列。

    • 软件包括以下内容:

      • “nvidia-driver=535.161.08”

      • “fabric-manager=535.161.08”

      • “cuda=12.3"

      • “cudnn=8.9.7"

      • “efa=1.32.0"

      • “nccl=2.21.5"

      • “aws-nccl-ofi-plugin=v1.9.1-aws”

  • 添加了 tensorflow 虚拟环境(激活命令源/opt/tensorflow/bin/activate)。此环境包括以下内容:

    • “tensorflow=2.16.1"

    • 便条

      • 从 TF2 .16 开始,tf.estimator API 已被移除。

      • 为了确保与客户工作流程的兼容性,我们使用环境变量 TF_USE_LEGACY_KERAS=1 将 Keras 版本固定为 2.0。如果您的工作流程需要使用 Keras 3.0,请使用以下脚本从您的 TensorFlow 虚拟环境 /opt/tensorflow 中移除此环境变量:

source /opt/tensorflow/bin/activate unset TF_USE_LEGACY_KERAS