为 Scikit-Learn 和 Spark ML 预建的亚马逊 SageMaker Docker 镜像 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为 Scikit-Learn 和 Spark ML 预建的亚马逊 SageMaker Docker 镜像

SageMaker提供预先构建的 Docker 镜像,用于安装 scikit-learn 和 Spark ML 库。这些库还包括构建与SageMaker使用亚马逊 SageMaker Python SDK 兼容的 Docker 镜像所需的依赖关系。通过使用该开发工具包,您可以使用 scikit-learn 执行机器学习任务,并使用 Spark ML 创建和优化机器学习管道。有关安装和使用该开发工具包的说明,请参阅 SageMaker Python 开发工具包

使用 SageMaker Python SDK

下表包含指向包含 scikit-learn 和 Spark ML 容器源代码的GitHub存储库的链接。该表还包含指向说明的链接,这些说明说明如何将这些容器与 Python SDK 估算器一起使用来运行自己的训练算法并托管自己的模型。

手动指定预建映像

如果您没有使用 SageMaker Python SDK 及其估算器之一来管理容器,则必须手动检索相关的预建容器。SageMaker预先构建的 Docker 映像。您可以使用它们的全名注册表地址推送或拉取它们。SageMaker在 scikit-learn 和 Spark ML 中使用以下 Docker Image 网址模式:

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>-cpu-py<PYTHON_VERSION>

    例如,746614075791.dkr.ecr.us-west-1.amazonaws.com/sagemaker-scikit-learn:0.23-1-cpu-py3

  • <ACCOUNT_ID>.dkr.ecr.<REGION_NAME>.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>

    例如,341280168497.dkr.ecr.ca-central-1.amazonaws.com/sagemaker-sparkml-serving:2.4

有关账户 ID 和Amazon区域名称,请参阅 Docker 注册表路径和示例代码

查找可用图片

使用以下使用使用使用以下使用使用使用以下使用使用以下使用使用以下使用使用以下 例如,使用以下内容查找该ca-central-1区域中的可用sagemaker-sparkml-serving图片:

aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving