Docker 容器故障排除故障 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Docker 容器故障排除故障

将 Docker 容器与 SageMaker ker 配合使用时,可能会遇到以下常见错误。每个错误后面都是错误的解决方案。

  • Error: SageMaker ker 守护程序已经丢失了 Docker 守护程序。

    要修复此错误,请使用以下命令重新启动 Docker。

    sudo service docker restart
  • Error: 这些区域有:/tmpDocker 容器的空间已经用尽了。

    Docker 容器使用//tmp分区来存储代码。在本地模式下使用大型代码模块时,这些分区可以很容易填充。SageMaker Python SDK 支持为本地模式根目录指定自定义临时目录,以避免此问题。

    要在 EBS 卷存储中指定自定义临时目录,请在以下路径中创建一个文件~/.sagemaker/config.yaml并添加以下配置。指定为container_root必须已存在。SageMaker Python 软件开发工具包不会尝试创建它。

    local: container_root: /home/ec2-user/SageMaker/temp

    使用此配置,本地模式将使用/temp目录,而不是默认的/tmp目录。