本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
访问 SageMaker HyperPod 集群节点
您可以使用 Amazon Systems Manager (SSM) 的 Amazon CLI 命令直接访问服务中的 SageMaker HyperPod 群集的节点。运行 aws ssm start-session
,并输入格式为 sagemaker-cluster:[cluster-id]_[instance-group-name]-[instance-id]
的节点主机名。您可以从SageMaker HyperPod 控制台检索集群 ID、实例 ID 和实例组名称,也可以通过运行和的Amazon CLI
命令来检索集群 ID、实例 ID describe-cluster
和list-cluster-nodes
实例组名称 SageMaker HyperPod。例如,如果集群 ID 是 aa11bbbbb222
,集群节点名称是 controller-group
,集群节点 ID 是 i-111222333444555aa
,则 SSM start-session
命令应如下所示。
注意
如果您尚未设置 Amazon Systems Manager,请按照中提供的说明进行操作为集群用户访问控制设置 Amazon Systems Manager 和运行方式。
$
aws ssm start-session \ --target sagemaker-cluster:
aa11bbbbb222
_controller-group
-i-111222333444555aa
\ --regionus-west-2
Starting session with SessionId: s0011223344aabbccdd
root@ip-111-22-333-444:/usr/bin#