对生命周期配置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对生命周期配置

以下主题介绍了如何获取有关生命周期配置的信息和调试。

验证亚马逊的生命周期配置流 CloudWatch 日志

仅记录生命周期配置STDOUTSTDERR.STDOUT是 bash 脚本的默认输出,而STDERR可以通过附加写入>&2到 bash 命令的末尾。例如,echo 'hello'>&2。生命周期配置的日志将发布到Amazon通过 CloudWatch 账户。这些日志可以在/aws/sagemaker/studio从日志流AmazonCloudWatch 控制台。

  1. 打开 CloudWatch 控制台https://console.aws.amazon.com/cloudwatch/.

  2. SelectLogs从左侧。在下拉菜单中,选择Log Groups.

  3. 在存储库的Log Groups屏幕,搜索aws/sagemaker/studio. 选择 日志组。

  4. 在存储库的aws/sagemaker/studio Log Group屏幕上,导航到Log Streams选项卡。

  5. 要查找特定应用程序的日志,请搜索Log Streams使用以下格式:

    <DomainId>/<UserProfileName>/<AppType>/<AppName>

    例如,要查找域的生命周期配置日志d-m85lcu8vbqmz、 UserProfile i-sonic-js,AppTypeJupyterServer和 AppNametest-lcc-echo中,使用以下搜索字符串:

    d-m85lcu8vbqmz/i-sonic-js/JupyterServer/test-lcc-echo
  6. 选择附加到的日志流LifecycleConfigOnStart以查看脚本执行日志。

JupyterServer 应用程序失败

如果您的 JupyterServer 由于附加的生命周期配置出现问题,应用程序崩溃,Studio 在 Studio 启动屏幕上显示以下错误消息。

Failed to create SageMaker Studio due to start-up script failure

单击View script logs链接以查看 CloudWatch 的日志 JupyterServer 应用程序。

如果在DefaultResourceSpec在你的 Studio 域或 UserProfile 中,即使在重新启动 Studio 之后,Studio 仍会继续使用生命周期配置。

要解决此错误,请按照中的步骤进行操作设置默认周期配置从中删除生命周期配置脚本DefaultResourceSpec或者使用Amazon CLI. 然后启动新的 JupyterServer 应用程序。

KernelGateway 应用程序故

如果您的 KernelGateway 由于附加的生命周期配置存在问题,应用程序崩溃,Studio 会在您的 Studio Notebook 中显示错误消息。

单击View script logs链接以查看 CloudWatch 的日志 KernelGateway 应用程序。

在这种情况下,启动新的 Studio 笔记本电脑时,您的生命周期配置是在 Studio Launcher 中指定的。

要解决此错误,请使用 Studio 启动器选择不同的生命周期配置或选择No script.

注意

一个默认 KernelGateway 在中指定的生命周期DefaultResourceSpec适用于所有 KernelGateway 除非用户从 Studio 启动器中显示的列表中选择了不同的脚本,否则 Studio Domain 中的映像。默认脚本也会运行No Script是由用户选择的。有关如何选择脚本的更多信息,请参阅第 3 步:启动新应用程序时选择生命周期配置.

周期 Config 超时

生命周期配置超时限制为 5 分钟。如果生命周期配置脚本运行时间超过 5 分钟,Studio 会抛出错误。

要解决此错误,请确保生命周期配置脚本在 5 分钟内完成。