适用于 Scikit-learn 和 Spark ML 的预构建 Amazon SageMaker Docker 映像
SageMaker 提供预构建的 Docker 映像,用于安装 scikit-learn 和 Spark ML 库。这些库还包所需的依赖项,用于使用 Amazon SageMaker Python SDK
使用 SageMaker Python SDK
下表包含指向 GitHub 存储库的链接,其中提供 scikit-learn 和 Spark ML 容器的源代码。该表还包含指向说明的链接,用于演示如何将这些容器与 Python SDK 估计器结合使用,以便运行自己的训练算法和托管自己的模型。
Library | 预构建的 Docker 映像源代码 | 说明 |
---|---|---|
scikit-learn | ||
Spark ML |
有关更多信息和 Github 存储库的链接,请参阅将 Scikit-learn 与 Amazon SageMaker 结合使用和将 SparkML Serving 与 Amazon SageMaker 结合使用。
手动指定预构建映像
如果您没有使用 SageMaker Python SDK 及估算器之一来管理容器,则您必须手动检索相关的预构建容器。SageMaker 预构建的 Docker 映像存储在 Amazon Elastic Container Registry (Amazon ECR) 中。您可以使用其全名注册表地址推送或提取它们。SageMaker 为 scikit-learn 和 Spark ML 使用以下 Docker 映像 URL 模式:
-
<ACCOUNT_ID>
.dkr.ecr.<REGION_NAME>
.amazonaws.com/sagemaker-scikit-learn:<SCIKIT-LEARN_VERSION>
-cpu-py<PYTHON_VERSION>
例如
746614075791
.dkr.ecr.us-west-1
.amazonaws.com/sagemaker-scikit-learn:1.2-1-cpu-py3
-
<ACCOUNT_ID>
.dkr.ecr.<REGION_NAME>
.amazonaws.com/sagemaker-sparkml-serving:<SPARK-ML_VERSION>
例如
341280168497
.dkr.ecr.ca-central-1
.amazonaws.com/sagemaker-sparkml-serving:2.4
有关账户 ID 和 Amazon 区域名称,请参阅 Docker 注册表路径和示例代码。
查找可用的映像
使用以下命令找出哪些版本的映像可用。例如,使用以下命令来查找可用 ca-central-1
区域中的可用 sagemaker-sparkml-serving
映像:
aws \ ecr describe-images \ --region ca-central-1 \ --registry-id 341280168497 \ --repository-name sagemaker-sparkml-serving