深度学习 AMI
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

EKS 上的 AWS Deep Learning Containers词汇表

EKS 和深度学习容器术语词汇表

以下词汇表解释了本指南中提到的工具:

  • AWS CLI:用于与许多 AWS 服务(如 aws eks --[args])交互的命令行工具

  • aws-iam-authenticator:验证 EC2 实例是否具有适当的 AWS 凭证来访问 EKS。在这些凭证上可以应用授权或拒绝访问和功能性的策略。

  • 集群:在一个或多个 EC2 实例上运行的一个或多个容器

  • 容器:虚拟化的操作系统和/或服务

  • EC2 实例或 Amazon 机器映像 (AMI):AMI 和实例常常互用。AMI 是在实例类型上运行的主机操作系统和捆绑软件,在速度、容量和算力上存在不同。GPU 是实例的可选计算硬件,被建议用于大多数深度学习应用程序中。EC2 实例随 AMI 一起加载,它们合在一起是您的“云计算机”。然后,使用来自 AMI 的操作系统运行容器。

  • EKS:Amazon Elastic Container Service for Kubernetes (Amazon EKS)。EKS 具有用来管理、扩展和部署 Kubernetes 容器的工具和让容器运行的任务。 

  • eksctl:在 EKS 上创建 Kubernetes 集群的命令行工具。

  • IAM:AWS 服务的身份管理工具

  • ksonnetKubernetes 清单的配置管理工具。

  • ksonnet 包:一个 ksonnet 应用程序可以分成一系列单独的组件。 组件可以很简单,如只是一个 Kubernetes 资源(例如部署),也可以很复杂,如一个完整的日志记录堆栈。 原型是可以用作您的组件的基础的示例。 使用原型可以避免复制和粘贴样本代码,从而将精力专注在特定于您的应用程序的配置部分上。  软件包是一组相关的原型和帮助程序库,用来定义原型部分。  利用软件包可以在任何 ksonnet 应用程序中轻松分发和复用代码。 有关 ksonnet 软件包的更多信息,请参阅 ksonnet 项目 github 存储库中的ksonnet 概念文档

  • Kubeconfig:用于配置集群访问权的文件,有时称为 kubeconfig 文件。这是引用配置文件的通用方式。这并不意味着有一个名为 kubeconfig 的文件。该文件的默认位置在 ~/.kube

  • kubectl:针对 Kubernetes 集群运行命令的命令行界面。

  • Kubeflow:使得在 Kubernetes 上部署机器学习 (ML) 工作流变得简单、可移植和可扩展的工具。使用 Kubeflow 有助于独立于集群设置来部署 ML 工作负载,进而有助于支持 ML 工作流生命周期的复现性,以及跨不同工作流复用构建块。Kubeflow 还支持 ML 工作流中的可视化和协作。

  • Kubernetes 或 k8s:用于扩展、部署和管理容器化应用程序的容器编排。

  • 清单:包含属于一个集合或整合单元的一组伴随文件的元数据的文件。在 Kubernetes 语法中,在资源清单文件中定义部署的资源集和资源的所需状态。

  • 命名空间:Kubernetes 支持同一个物理集群支持下的多个虚拟集群。这些虚拟集群称为命名空间。命名空间提供了一个名称范围。在同一个命名空间中,资源名称必须唯一,但在不同命名空间中则不需要。 命名空间是在多个用户之间划分集群资源的方式。命名空间适用于众多用户分散在多个团队或项目中的环境。 

  • pod:提供一项服务或功能的相关容器的集合。 

  • pod 文件:一个 yaml 格式的文件,其中包含有关 pod 的说明,包括集群应运行哪些操作或作业的引用。