使用生命周期配置脚本自定义笔记本实例 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用生命周期配置脚本自定义笔记本实例

要在笔记本实例上安装程序包或示例笔记本,请为其配置网络和安全性,或者使用 Shell 脚本对其进行自定义以使用生命周期配置。生命周期配置 提供了 Shell 脚本,仅在您创建笔记本实例或者随时启动笔记本实例时运行。当您创建笔记本实例时,您可以创建新的生命周期配置以及它使用的脚本,或者应用您已有的实例。

您还可以使用生命周期配置脚本访问Amazon笔记本电脑提供的服务。例如,您可以创建一个脚本来让您使用笔记本控制其他Amazon资源,例如 Amazon EMR 实例。

我们维护一个笔记本生命周期配置脚本的公有存储库,用于解决自定义笔记本实例的常见使用案例,网址为:https://github.com/aws-samples/amazon-sagemaker-notebook-instance-lifecycle-configuration-samples

注意

每个脚本只能有 16384 个字符。

可用于这两个脚本的 $PATH 环境变量的值是 /usr/local/sbin:/usr/local/bin:/usr/bin:/usr/sbin:/sbin:/bin。工作目录(这是 $PWD 环境变量的值)是 /

查看 CloudWatch 日志组中笔记本实例生命周期配置的日志/aws/sagemaker/NotebookInstances在日志流中[notebook-instance-name]/[LifecycleConfigHook].

脚本运行时间不能超过 5 分钟。如果脚本运行时间超过 5 分钟,它会失败,并且不创建或启动笔记本实例。要帮助减少脚本的运行时间,请尝试采取以下措施:

  • 减少所需的步骤。例如,限制在其中安装大型包的 conda 环境。

  • 在并行进程中运行任务。

  • 在脚本中使用 nohup 命令。

您可以通过选择以前创建的笔记本实例生命周期配置列表。生命周期配置中的 SageMaker 控制台。这些笔记本实例生命周期配置在您创建新笔记本实例时可用。

创建生命周期配置
  1. 打开 SageMaker 控制台https://console.aws.amazon.com/sagemaker/.

  2. 在左侧,选择笔记本.

  3. 从下拉菜单中,选择生命期配置.

  4. 生命期配置页面,选择创建配置.

  5. 对于名称,请键入使用字母数字字符和 -(但不能含空格)的名称。名称最多可包含 63 个字符。

  6. (可选) 要创建在您创建笔记本和每次启动笔记本时运行的脚本,请选择 Start notebook (启动笔记本)

  7. Start notebook (启动笔记本) 编辑器中,键入脚本。

  8. (可选)要创建仅运行一次的脚本,则在创建笔记本时,选择 Create notebook (创建笔记本)

  9. Create notebook (创建笔记本) 编辑器中,键入脚本配置网络。

  10. 选择 Create configuration(创建配置)。