检索 SageMaker HyperPod 集群详细信息
了解如何使用 Amazon CLI 检索 SageMaker HyperPod 集群详细信息。
描述集群
运行 describe-cluster 查看集群状态。您可以指定集群的名称或 ARN。
aws sagemaker describe-cluster --cluster-nameyour-hyperpod-cluster
集群状态变为 InService 后,进入下一步。使用此 API,还可以检索运行其他 HyperPod API 操作时的失败消息。
列出集群节点的详细信息
运行 list-cluster-nodes 查看集群节点的关键信息。
aws sagemaker list-cluster-nodes --cluster-nameyour-hyperpod-cluster
这将返回一个响应,InstanceId 是您需要用来登录(使用 aws ssm)的内容。
描述集群节点的详细信息
运行 describe-cluster-node 可获取集群节点的详细信息。您可以从 list-cluster-nodes 输出中获取集群节点 ID。您可以指定集群的名称或 ARN。
aws sagemaker describe-cluster-node \ --cluster-nameyour-hyperpod-cluster\ --node-idi-111222333444555aa
列出集群
运行 list-clusters 列出账户中的所有集群。
aws sagemaker list-clusters
您还可以添加其他标签来筛选集群列表。要进一步了解该命令在底层运行的内容以及用于筛选的其他标签,请参阅 ListClusters API 参考。