开始使用亚马逊 SageMaker 笔记本实例 - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用亚马逊 SageMaker 笔记本实例

机器学习 (ML) 从业者使用 Amazon 的最佳方式之一 SageMaker 是使用 SageMaker 笔记本实例训练和部署 ML 模型。 SageMaker 笔记本实例通过在 Amazon Elastic Compute Cloud (Amazon EC2) 上启动 Jupyter 服务器并为预配置的内核提供以下软件包来帮助创建环境:Amaz SageMaker on Python SDK、,Amazon Command Line Interface (Amazon CLI)、Conda、Pandas、深度学习框架库以及其他用于数据科学和机器学习的库。Amazon SDK for Python (Boto3)

使用 SageMaker Python 开发工具包进行Machine Learning

要在 SageMaker 笔记本实例中训练、验证、部署和评估 ML 模型,请使用 SageMaker Python SDK。 SageMaker Python 软件开发工具包抽象Amazon SDK for Python (Boto3)和 SageMaker API 操作。它使您能够集成和协调其他Amazon服务,例如 Amazon Simple Storage Service (Amazon S3) 用于保存数据和模型构件、用于导入和服务机器学习模型的 Amazon Elastic Compute Cloud (Amazon EC2)。

您还可以利用可帮助您处理完整机器学习周期各个阶段的 SageMaker 功能:数据标记、数据预处理、模型训练、模型部署、预测性能评估以及监控生产中模型的质量。

如果您是初次使用的 SageMaker 用户,我们建议您按照 end-to-end 机器学习教程使用 SageMaker Python SDK。要查找开源文档,请参阅亚马逊 SageMaker Python SDK

教程概览

本入门教程将引导您完成如何创建 SageMaker 笔记本实例、在 Conda 环境中打开带有预配置内核的 Jupyter 笔记本进行机器学习,以及如何启动 SageMaker 会话以运行 end-to-end ML 循环。您将学习如何将数据集保存到与会 SageMaker话自动配对的默认 Amazon S3 存储桶,向 Amazon EC2 提交 ML 模型的训练任务,以及如何通过 Amazon EC2 托管或批量推理部署经过训练的模型进行预测。

本教程明确显示了从 SageMaker 内置模型池训练 XGBoost 模型的完整机器学习流程。您使用美国成人人口普查数据集,然后评估经过训练的 SageMaker XGBoost 模型在预测个人收入方面的表现。