使用 A SageMaker I 控制台根据训练计划创建 SageMaker HyperPod集群 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 A SageMaker I 控制台根据训练计划创建 SageMaker HyperPod集群

要使用 SageMaker AI 控制台界面的训练计划创建 SageMaker HyperPod 集群,请按照以下步骤操作:

  1. 导航到 SageMaker AI 控制台,网址为https://console.aws.amazon.com/sagemaker/

  2. 在左侧导航窗格中,选择 Hyperpod,然后选择创建集群

  3. 配置实例组时,您可以选择符合您的计算容量需求的计划。

SageMaker AI 控制台界面显示了用于在 SageMaker HyperPod 集群中创建实例组的模式窗口。该表单包含实例组名称、实例类型、数量、实例容量(包括按需计划和训练计划的选项)以及创建时生命周期脚本的目录路径所对应的字段。

查看和创建集群。当训练计划变为 Active 时,使用训练计划的实例组会纵向扩展到指定的目标实例数,视可用容量而定。在每个预留容量期结束前三十分钟,实例组开始缩减到零个实例。这种缩减状态会持续到下一个预留容量期开始或计划结束。在整个过程中,运行状况良好的实例组在初始创建后会保持 InService 状态,无论当前实例数量如何。