检索 SageMaker HyperPod 集群详细信息 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检索 SageMaker HyperPod 集群详细信息

了解如何使用检索 SageMaker HyperPod 集群详细信息 Amazon CLI。

描述集群

运行 describe-cluster 查看集群状态。您可以指定集群的名称或 ARN。

aws sagemaker describe-cluster --cluster-name your-hyperpod-cluster

集群状态变为 InService 后,进入下一步。使用此 API,您还可以从运行其他 HyperPod API 操作中检索失败消息。

列出集群节点的详细信息

运行list-cluster-nodes以检查群集节点的密钥信息。

aws sagemaker list-cluster-nodes --cluster-name your-hyperpod-cluster

这将返回一个响应,InstanceId 是您需要用来登录(使用 aws ssm)的内容。

描述集群节点的详细信息

运行describe-cluster-node以检索群集节点的详细信息。您可以从 list-cluster-nodes输出中获取群集节点 ID。您可以指定集群的名称或 ARN。

aws sagemaker describe-cluster-node \ --cluster-name your-hyperpod-cluster \ --node-id i-111222333444555aa

列出集群

运行 list-clusters 列出账户中的所有集群。

aws sagemaker list-clusters

您还可以添加其他标签来筛选集群列表。要详细了解此命令在低级别运行的内容以及用于过滤的其他标志,请参阅 ListClustersAPI 参考。