Amazon SageMaker 笔记本实例入门 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker 笔记本实例入门

机器学习 (ML) 实践者使用 的最佳方式之一Amazon SageMaker是使用SageMaker笔记本实例训练和部署 ML 模型。SageMaker 笔记本实例通过在 Amazon Elastic Compute Cloud (Amazon EC2) 上启动 Jupyter 服务器并使用以下程序包提供预配置内核来帮助创建环境Amazon SageMaker:Python 开发工具包适用于 Python (Boto3) 的 AWS 软件开发工具包、、 AWS Command Line Interface (AWS CLI)、Conda、Pandas、深度学习框架库以及其他用于数据科学和机器学习的库。

使用 SageMaker Python 开发工具包的 Machine Learning

要在SageMaker笔记本实例中训练、验证、部署和评估 ML 模型,请使用 SageMaker Python 开发工具包提取 适用于 Python (Boto3) 的 AWS 软件开发工具包 和 SageMaker API 操作。它使您能够协调基础设施,例如用于保存数据和模型构件的 AWS (Amazon Simple Storage Service) Amazon S3 和用于导入和处理 ML 模型的 Amazon Elastic Container Registry (ECR),用于训练和推理的 Amazon Elastic Compute Cloud (Amazon EC2)。

您还可以利用可帮助您处理完整 ML 周期的每个阶段SageMaker的功能:数据标记、数据预处理、模型训练、模型部署、预测性能评估以及监控生产中的模型质量。

如果您是新SageMaker用户,我们建议您按照端到端 ML 教程使用 SageMaker Python 开发工具包。要查找开源文档,请参阅 Amazon SageMaker Python SDK

教程概述

本入门教程将指导您如何创建SageMaker笔记本实例,使用适用于机器学习的 Conda 环境打开具有预配置的内核的 Jupyter 笔记本,并启动SageMaker会话以运行端到端 ML 周期。您将了解如何将数据集保存到自动与Amazon S3会话配对的默认 SageMaker 存储桶,将 ML 模型的训练作业提交到 Amazon EC2,并通过 托管或批量引用来部署训练后的模型以进行预测Amazon EC2。

本教程显式显示从XGBoost内置SageMaker模型池训练模型的完整 ML 流程。您可以使用美国成人普查数据集,并根据预测个人收入来评估训练SageMakerXGBoost模型的性能。