检索 SageMaker HyperPod 集群详细信息 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检索 SageMaker HyperPod 集群详细信息

了解如何使用检索 SageMaker HyperPod 集群详细信息 Amazon CLI。

描述集群

运行 d escribe-cluster 以检查集群的状态。您可以指定集群ARN的名称或名称。

aws sagemaker describe-cluster --cluster-name your-hyperpod-cluster

集群的状态变为后InService,继续下一步。使用它API,您还可以从运行其他 HyperPod API操作中检索失败消息。

列出集群节点的详细信息

运行list-cluster-nodes以检查群集节点的密钥信息。

aws sagemaker list-cluster-nodes --cluster-name your-hyperpod-cluster

这将返回一个响应,InstanceId这是你需要用来登录(使用aws ssm)响应的内容。

描述群集节点的详细信息

运行describe-cluster-node以检索群集节点的详细信息。您可以从 list-cluster-nodes输出中获取群集节点 ID。您可以指定集群ARN的名称或名称。

aws sagemaker describe-cluster-node \ --cluster-name your-hyperpod-cluster \ --node-id i-111222333444555aa

列出集群

运行 list-clust ers 列出您账户中的所有集群。

aws sagemaker list-clusters

您还可以添加其他标志来向下筛选集群列表。要详细了解此命令在低级别运行的内容以及用于过滤的其他标志,请参阅ListClustersAPI参考资料。