使用生命周期配置脚本自定义笔记本实例 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用生命周期配置脚本自定义笔记本实例

要在笔记本实例上安装程序包或示例笔记本,请为其配置网络和安全性,或者使用 Shell 脚本对其进行自定义以使用生命周期配置。生命周期配置提供 Shell 脚本,仅在您创建笔记本实例或每次启动笔记本实例时运行。当您创建笔记本实例时,您可以创建新的生命周期配置以及它使用的脚本,或者应用您已有的实例。

您还可以使用生命周期配置脚本从笔记本访问 AWS 服务。例如,您可以创建一个脚本来让您使用笔记本控制其他 AWS 资源,例如 Amazon EMR 实例。

我们维护一个笔记本生命周期配置脚本的公有存储库,用于解决自定义笔记本实例的常见使用案例,网址为:https://github.com/aws-samples/amazon-sagemaker-notebook-instance-lifecycle-configuration-samples.

注意

每个脚本只能有 16384 个字符。

可用于两个脚本的 $PATH 环境变量的值为 /usr/local/sbin:/usr/local/bin:/usr/bin:/usr/sbin:/sbin:/bin。 工作目录(即 $PWD 环境变量的值)为 /

查看 CloudWatch Logs,以查看日志流 /aws/sagemaker/NotebookInstances 的日志组 [notebook-instance-name]/[LifecycleConfigHook]. 中的笔记本实例生命周期配置。

脚本运行时间不能超过 5 分钟。如果脚本运行时间超过 5 分钟,它会失败,并且不创建或启动笔记本实例。要帮助减少脚本的运行时间,请尝试采取以下措施:

  • 减少所需的步骤。例如,限制在其中安装大型包的 conda 环境。

  • 在并行进程中运行任务。

  • 在脚本中使用 nohup 命令。

创建生命周期配置

  1. 对于 Lifecycle configuration - Optional (生命周期配置 - 可选),选择 Create a new lifecycle configuration (创建新生命周期配置).

  2. 对于 Name (名称),请使用字母数字字符和“-”键入名称,但不能键入空格。名称最多可包含 63 个字符。

  3. (可选) 要创建在您创建笔记本和每次启动笔记本时运行的脚本,请选择 Start notebook (启动笔记本).

  4. Start notebook 编辑器中,键入脚本。

  5. (可选)要创建仅运行一次的脚本,则在创建笔记本时,选择 Create notebook (创建笔记本).

  6. Create notebook 编辑器中,键入脚本 configure networking。

  7. 选择 Create configuration (创建配置).

您可以通过在 控制台中选择 Lifecycle configuration (生命周期配置) 来查看之前创建的笔记本实例生命周期配置SageMaker的列表。从这里可以查看、编辑、删除现有生命周期配置。您可以通过选择 Create configuration (创建配置). 创建一个新的笔记本实例生命周期配置。这些笔记本实例生命周期配置在您创建新笔记本实例时可用。