自定义SageMaker映像规范 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自定义SageMaker映像规范

以下规范适用于映像版本表示的SageMaker容器映像。

运行映像

ENTRYPOINT 将覆盖 和 CMD 指令以使映像能够作为KernelGateway应用程序运行。

映像中的端口 8888 保留用于运行 KernelGateway Web 服务器。

停止映像

DeleteApp API 发出与docker stop命令等效的命令。容器中的其他进程将不会获得 SIGKILL/SIGTERM 信号。

内核发现

SageMaker 根据 Jupyter 内核规范的定义识别内核。

您可以在运行映像之前指定要显示的内核列表。如果未指定,则显示 python3。使用 DescribeAppImageConfig API 查看内核列表。

默认情况下,Conda 环境被视为内核规范。

文件系统

/opt/.sagemakerinternal/opt/ml 目录是预留的。这些目录中的任何数据在运行时可能不可见。

用户数据

Studio 域中的每个用户都会在图像中的共享Amazon Elastic File System卷上获取用户目录。当前用户目录在Amazon EFS卷上的位置是可配置的。默认情况下,目录的位置是 /home/sagemaker-user

SageMaker 在映像和主机之间配置 POSIX UID/GID 映射。这默认为将根用户的 UID/GID (0/0) 映射到主机上的 UID/GID。

您可以使用 CreateAppImageConfig API 指定这些值。

元数据

元数据文件位于 /opt/ml/metadata/resource-metadata.json。 不向映像中定义的变量添加其他环境变量。有关更多信息,请参阅获取应用程序元数据.

GPU

在 GPU 实例上,映像与 --gpus 选项一起运行。仅 CUDA 工具包应包含在映像中,而不应包含 NVIDIA 驱动程序。有关更多信息,请参阅 NVIDIA 用户指南

指标和日志记录

KernelGateway 进程中的日志将发送到客户账户Amazon CloudWatch中的 。日志组的名称为 /aws/sagemaker/studio。 日志流的名称为 $domainID/$userProfileName/KernelGateway/$appName

映像大小

限制为 11 GB。