为自定义 Amazon Linux 2 AMI 配置 DL1 - Amazon EKS
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

为自定义 Amazon Linux 2 AMI 配置 DL1

Amazon EKS 中的自定义 Amazon Linux 2 AMI 可以通过额外的配置和 Kubernetes 附加组件大规模支持深度学习工作负载。本文档介绍了为本地设置或作为较大云配置中的基准设置通用 Kubernetes 解决方案所需的组件。要支持此函数,您必须在自定义环境中执行以下步骤:

  • SynapaseAI® Software 驱动程序加载到系统中:这些驱动程序包含在 Github 上可用的 AMI

    Habana 设备插件 — 一个 Daemonset,允许您在 Kubernetes 集群中自动启用 Habana 设备注册并跟踪设备运行状况。

  • Kubernetes 版本最高至 1.21(已通过测试确认)。

  • Helm 3.x

  • 用于安装 MPI Operator 的 Helm Chart

  • MPI Operator

  1. 从 Amazon Linux 2、Ubuntu 18 或 Ubuntu 20 创建并启动基本 AMI。

  2. 跟随这些说明以为 DL1 设置环境。