自定义 Amazon SageMaker Studio - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

自定义 Amazon SageMaker Studio

有四个选项可用于自定义 Amazon SageMaker Studio 环境。您可以自带 SageMaker 映像,使用生命周期配置脚本,将建议的 Git 存储库附加到 Studio,或者在 Amazon EFS 中使用持久性 Conda 环境创建内核。各个选项可单独使用,也可一起使用。

  • 自带 SageMaker 映像:SageMaker 映像是一个文件,它标识在 Amazon SageMaker Studio 中运行 Jupyter 笔记本所需的内核、语言包和其他依赖项。Amazon SageMaker 提供了许多内置映像供您使用。如果您需要不同的功能,可以将自己的自定义映像添加到 Studio 中。

  • 在 Amazon SageMaker Studio 中使用生命周期配置:生命周期配置是由 Amazon SageMaker Studio 生命周期事件(如启动新的 Studio 笔记本)触发的 Shell 脚本。您可以使用生命周期配置来自动自定义 Studio 环境。例如,您可以安装自定义软件包、配置笔记本扩展、预加载数据集和设置源代码存储库。

  • 将建议的 Git 存储库附加到 Studio:您可以在 Amazon SageMaker 域或用户配置文件级别附加建议的 Git 存储库 URL。然后,您可以从建议列表中选择存储库 URL,然后使用 Studio 中的 Git 扩展将其克隆到您的环境中。

  • 将 Conda 环境持久化到 Studio Amazon EFS 卷:Studio 使用 Amazon EFS 卷作为持久化存储层。您可以在这个 Amazon EFS 卷上保存 Conda 环境,然后使用保存的环境创建内核。Studio 会自动提取保存在 Amazon EFS 中的所有有效环境作为 KernelGateway 内核。这些内核会一直持续到内核、应用程序和 Studio 的重启为止。有关更多信息,请参阅在 Amazon SageMaker Studio 笔记本中管理 Python 软件包的四种方法中的将 Conda 环境持久化到 Studio EFS 卷部分。

以下主题介绍如何使用这三个选项来自定义 Amazon SageMaker Studio 环境。