什么是 Amazon 深度学习 Containers? - Amazon 深度学习容器
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 Amazon 深度学习 Containers?

Amazon Deep Learning Containers 是预先构建的 Docker 镜像,可以更轻松地运行流行的深度学习框架和工具。 Amazon它们为 Amazon 基础架构上托管的深度学习应用程序提供一致 up-to-date、安全和优化的运行时环境。要开始使用,请参阅 Dee Amazon p Learning Containers 入门

主要功能

预安装的深度学习框架

Amazon Deep Learning Containers 包括领先的深度学习框架的预安装和配置版本,例如 TensorFlow 和。 PyTorch这样就无需从头开始构建和维护自己的 Docker 镜像。

硬件加速

Amazon Deep Learning Containers 针对基于 CPU、GPU 加速和基于硅的深度学习进行了优化。 Amazon 它们支持 CUDA、cuDNN 和其他必要的库,以利用基于 GPU 的 EC2 亚马逊实例以及由 G CPUs raviton 和 Tra GPUs inium 以及英特尔的 Habana-Gaudi 处理器等设计的芯片 Amazon以及英特尔的 Habana-Gaudi 处理器的强大功能。 Amazon

Amazon 服务集成

Amazon Deep Learning Containers 可与各种 Amazon 服务无缝集成,包括 SageMaker 人工智能、亚马逊弹性容器服务 (ECS)、亚马逊 Elastic Kubernetes Service (EKS)、亚马逊和 EC2 Amazon ParallelCluster 这样可以轻松地在 Amazon 基础架构上部署和运行深度学习模型和应用程序。

安全且定期更新

Amazon 定期维护和更新 Dee Amazon p Learning Containers,以确保您可以访问最新版本的深度学习框架和依赖关系。这有助于保持 Amazon基于您的深度学习环境的安全 up-to-date,并且无需自己管理安全补丁和更新的开销。使用最新的安全补丁更新深度学习容器可能是一项资源密集型任务,但是 Dee Amazon p Learning Containers 通过提供定期的自动更新来消除这种负担。这样可以确保您的深度学习环境保持安全和最新,而无需您进行大量手动操作。通过自动化更新过程,Dee Amazon p Learning Containers 使您可以专注于开发深度学习模型和应用程序,而不必担心底层基础设施和安全维护,这可以提高团队的工作效率,并使您能够在托管的项目中更有效地利用最新的深度学习功能。 Amazon

应用场景

Amazon Deep Learning Containers 在以下 Amazon基于深度学习的场景中特别有用:

模型训练

使用 Dee Amazon p Learning Containers 在基于 CPU、GPU 加速或硅驱动的 Amazon Amazon EC2 实例上训练您的深度学习模型,或者在 Hyperpod 上利用多节点训练。 Amazon ParallelCluster SageMaker

模型部署

使用 Dee Amazon p Learning Containers 部署经过训练的模型,以便通过人工智能等方式进行可扩展 Amazon、可用于生产的推理。 SageMaker

实验和原型制作

Amazon 使用预先配置的容器快速启动深度学习开发环境。 Amazon Deep Learning Containers 是 SageMaker AI Studio 中笔记本的默认选项,可以轻松开始实验和原型设计。

持续集成和交付

将容器集成到 Amazon基于您的 CI/CD 管道中,例如使用 Amazon ECS 或 Amazon EKS 的容器,以实现一致、自动化的深度学习工作负载。