对Docker容器进行故障排除 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对Docker容器进行故障排除

以下是您在使用Docker容器时可能遇到的常见错误 SageMaker。每个错误的后面都提供了错误的解决方案。

  • 错误: SageMaker Docker守护程序丢失。

    要修复此错误,请使用以下命令重新启动 Docker。

    sudo service docker restart
  • 错误:您的Docker容器/tmp目录空间不足。

    Docker容器使用//tmp分区来存储代码。在本地模式下使用大型代码模块时,这些分区很容易填满。 SageMakerPython SDK 支持为本地模式根目录指定自定义临时目录以避免此问题。

    要在 Amazon Elastic Block Store 卷存储中指定自定义临时目录,请在以下路径创建一个文件~/.sagemaker/config.yaml并添加以下配置。您指定作为 container_root 的目录必须已经存在。P SageMaker ython 软件开发工具包不会尝试创建它。

    local: container_root: /home/ec2-user/SageMaker/temp

    使用此配置,本地模式使用 /temp 目录而不是默认的 /tmp 目录。

  • SageMaker 笔记本实例出现空间不足错误

    默认情况下,在笔记本实例上运行的Docker容器使用 SageMaker 笔记本实例的 Amazon EBS 根 Amazon EBS 卷。要解决空间不足错误,请在Docker命令的卷参数中提供附加到笔记本实例的 Amazon EBS 卷的路径。

    docker run -v EBS-volume-path:container-path