检索 SageMaker HyperPod 集群详细信息 - Amazon SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

检索 SageMaker HyperPod 集群详细信息

了解如何使用 Amazon CLI 检索 SageMaker HyperPod 集群详细信息。

描述集群

运行 describe-cluster 查看集群状态。您可以指定集群的名称或 ARN。

aws sagemaker describe-cluster --cluster-name your-hyperpod-cluster

集群状态变为 InService 后,进入下一步。使用此 API,还可以检索运行其他 HyperPod API 操作时的失败消息。

列出集群节点的详细信息

运行 list-cluster-nodes 查看集群节点的关键信息。

aws sagemaker list-cluster-nodes --cluster-name your-hyperpod-cluster

这将返回一个响应,InstanceId 是您需要用来登录(使用 aws ssm)的内容。

描述集群节点的详细信息

运行 describe-cluster-node 可获取集群节点的详细信息。您可以从 list-cluster-nodes 输出中获取集群节点 ID。您可以指定集群的名称或 ARN。

aws sagemaker describe-cluster-node \ --cluster-name your-hyperpod-cluster \ --node-id i-111222333444555aa

列出集群

运行 list-clusters 列出账户中的所有集群。

aws sagemaker list-clusters

您还可以添加其他标签来筛选集群列表。要进一步了解该命令在底层运行的内容以及用于筛选的其他标签,请参阅 ListClusters API 参考。