使用生命周期配置脚本自定义笔记本实例
要在笔记本实例上安装软件包或示例笔记本,请为其配置联网和安全设置,或者使用 Shell 脚本对其进行自定义以使用生命周期配置。生命周期配置提供了 Shell 脚本,这些脚本仅在创建笔记本实例或启动实例时运行。当您创建笔记本实例时,可以创建新的生命周期配置及其使用的脚本,或者应用您已有的实例。
您还可以使用生命周期配置脚本从笔记本访问 Amazon 服务。例如,您可以创建一个脚本,该脚本允许您使用笔记本来控制其他 Amazon 资源,例如 Amazon EMR 实例。
我们维护一个笔记本生命周期配置脚本的公有存储库,用于解决自定义笔记本实例的常见使用案例,网址为:https://github.com/aws-samples/amazon-sagemaker-notebook-instance-lifecycle-configuration-samples
注意
每个脚本的字符数上限为 16384 个字符。
可用于这两个脚本的 $PATH
环境变量的值是 /usr/local/sbin:/usr/local/bin:/usr/bin:/usr/sbin:/sbin:/bin
。工作目录(这是 $PWD
环境变量的值)是 /
。
在 CloudWatch Logs 中查看日志流 [notebook-instance-name]/[LifecycleConfigHook]
的日志组 /aws/sagemaker/NotebookInstances
中的笔记本实例生命周期配置。
脚本运行时间不能超过 5 分钟。如果脚本运行时间超过 5 分钟,它会失败,并且不创建或启动笔记本实例。为了缩短脚本的运行时间,请尝试以下方法:
-
减少所需的步骤。例如,限制在哪些 conda 环境中安装大型软件包。
-
在并行进程中运行任务。
-
在脚本中使用
nohup
命令。
您可以通过在 SageMaker 控制台中选择生命周期配置,查看以前创建的笔记本实例生命周期配置列表。创建新笔记本实例时,可以附加笔记本实例生命周期配置。有关创建笔记本实例的更多信息,请参阅 创建笔记本实例。
创建生命周期配置
-
通过 https://console.aws.amazon.com/sagemaker/
打开 SageMaker 控制台。 -
在左侧导航窗格中,选择管理员配置。
-
在管理员配置下,选择生命周期配置。
-
在生命周期配置页面中,选择笔记本实例选项卡。
-
选择创建配置。
-
对于名称,请键入使用字母数字字符和 -(但不能含空格)的名称。名称最多可包含 63 个字符。
-
(可选)要创建在您创建笔记本和每次启动笔记本时运行的脚本,请选择启动笔记本。
-
在启动笔记本编辑器中,键入脚本。
-
(可选)要创建仅运行一次的脚本,则在创建笔记本时,选择创建笔记本。
-
在创建笔记本编辑器中,键入脚本配置网络。
-
选择创建配置。