用于 SageMaker HyperPod集群的自定义 Amazon 系统映像 (AMIs) - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用于 SageMaker HyperPod集群的自定义 Amazon 系统映像 (AMIs)

使用亚马逊提供并公开的基本亚马逊系统映像 (AMIs) SageMaker HyperPod,您可以构建自定义镜像 AMIs。借助自定义 AMI,您可以使用预先配置的软件堆栈、驱动程序自定义、专有依赖项和安全代理为 AI 工作负载创建专门的环境。此功能无需使用生命周期配置脚本进行复杂的启动后引导。

借助自定义 AMIs,您可以标准化不同阶段的环境,缩短启动时间,并完全控制运行时环境,同时利用 SageMaker HyperPod基础架构功能和扩展优势。这可以帮助您保持对人工智能基础架构的控制,同时仍能从优化的基础运行时间中 SageMaker HyperPod受益。

您可以通过添加安全代理、合规性工具和专用库在 SageMaker HyperPod 性能调整的基础映像的基础上进行构建,同时保留所有分布式训练的好处。此功能消除了以前需要在基础架构优化和组织安全策略之间做出选择。

自定义 AMI 体验与已建立的企业安全工作流程无缝集成。安全团队使用 SageMaker HyperPod's public AMIs 作为基础来构建经过强化的映像,而人工智能平台团队可以在通过创建或更新集群 AMIs 时指定这些自定义镜像。 SageMaker HyperPod APIs APIs 验证图像兼容性,处理必要的权限并保持向后兼容性,以便现有工作流程继续运行。具有严格安全协议的组织可以消除通过生命周期脚本在运行时安装安全代理这一容易出错的替代方案。通过与企业安全实践保持一致,而不是强迫组织调整协议以 SageMaker HyperPod适应局限性,自定义 AMIs 消除了运行关键 AI 工作负载的注重安全的组织采用的常见障碍。

有关向公众发布的更新的发行说明 AMIs,请参阅公开 AMI 发布。要了解如何开始构建自定义 AMI 并在 HyperPod 集群中使用它,请参阅以下主题。