调试生命周期配置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

调试生命周期配置

以下主题介绍如何获取有关生命周期配置的信息并调试生命周期配置。

通过 Amazon CloudWatch Logs 验证生命周期配置流程

仅生命周期配置日志STDOUTSTDERR.STDOUT是 bash 脚本的默认输出,而STDERR可以通过附加>&2添加到 bash 命令的末尾。例如:echo 'hello'>&2。生命周期配置的日志将发布到Amazon通过 CloudWatch 账户。这些日志可以在/aws/sagemaker/studio来自的日志流AmazonCloudWatch 控制台。

  1. 通过以下网址打开 CloudWatch 控制台:https://console.aws.amazon.com/cloudwatch/

  2. SelectLogs从左侧。从下拉菜单中,选择Log Groups.

  3. 在存储库的Log Groups屏幕, 搜索aws/sagemaker/studio. 选择 日志组。

  4. 在存储库的aws/sagemaker/studio Log Group屏幕中,导航到Log Streams选项卡。

  5. 要查找特定应用程序的日志,请搜索Log Streams使用以下格式:

    <DomainId>/<UserProfileName>/<AppType>/<AppName>

    例如,要查找域的生命周期配置日志d-m85lcu8vbqmz,UserProfilei-sonic-js,应用程序类型JupyterServer和 AppNametest-lcc-echo,请使用以下搜索字符串:

    d-m85lcu8vbqmz/i-sonic-js/JupyterServer/test-lcc-echo
  6. 选择附加到的日志流LifecycleConfigOnStart查看脚本执行日志。

JupyterServer 应用程序故障

如果 JupyterServer 应用程序由于附加的生命周期配置出现问题而崩溃,Studio 将在 Studio 启动屏幕上显示以下错误消息。

Failed to create SageMaker Studio due to start-up script failure

单击View script logs链接,查看 JupyterServer 应用程序的云观看日志。

如果错误的生命周期配置在DefaultResourceSpec,即使在重新启 UserProfile Studio 后,Studio 仍会继续使用生命周期配置。

若要解决此错误,请按照设置默认生命周期配置将生命周期配置脚本从DefaultResourceSpec或使用Amazon CLI. 然后启动一个新的 JupyterServer 应用程序。

内核网关应用程序故障

如果您的 KernelGateway 应用程序因附加的生命周期配置出现问题而崩溃,Studio 将在您的 Studio 笔记本中显示错误消息。

单击View script logs链接,查看您的客户端网关应用的云观看日志。

在这种情况下,启动新的 Studio 笔记本电脑时,将在 Studio 启动器中指定您的生命周期配置。

要解决此错误,请使用 Studio 启动程序选择不同的生命周期配置,或选择No script.

注意

中指定的默认内核网关生命周期配置DefaultResourceSpec应用于 Studio 域中的所有 KernelGateway 映像,除非用户从 Studio 启动器中显示的列表中选择了不同的脚本。默认脚本也会运行No Script由用户选择。有关如何选择脚本的更多信息,请参阅第 3 步:启动新应用程序时选择生命周期配置.

生命周期 Config 超时

生命周期配置超时限制为 5 分钟。如果生命周期配置脚本运行时间超过 5 分钟,Studio 将引发错误。

要解决此错误,请确保生命周期配置脚本在 5 分钟内完成。