开始使用 Amazon SageMaker 笔记本实例 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon SageMaker 笔记本实例

机器学习 (ML) 从业人员使用 Amazon SageMaker 的最佳方法之一是使用 SageMaker 笔记本实例培训和部署 ML 模型。SageMaker 笔记本实例通过在亚马逊 Elastic Compute Cloud (Amazon EC2) 上启动 Jupyter 服务器并提供具有以下软件包的预配置内核来帮助创建环境:Amazon SageMaker Python SDK、Amazon SDK for Python (Boto3)、Amazon Command Line Interface(Amazon CLI)、Conda、熊猫、深度学习框架库以及其他用于数据科学和机器学习的库。

利用 SageMaker Python 开发工具包进行 Machine Learning

要在 SageMaker 笔记本实例中训练、验证、部署和评估 ML 模型,请使用 SageMaker Python 开发工具包。SageMaker Python 软件开发工具包摘要Amazon SDK for Python (Boto3)和 SageMaker API 操作。它使您能够与其他Amazon服务,例如用于保存数据和模型构件的 Amazon Simple Storage Service (Amazon S3)、Amazon Elastic Compute Cloud (ECR)、Amazon Elastic Compute Cloud (Amazon EC2) 以及用于训练和推理的 Amazon Elastic Compute Cloud (Amazon EC2)。

您还可以利用 SageMaker 功能来帮助您处理完整 ML 周期的每个阶段:数据标签、数据预处理、模型培训、模型部署、预测性能评估以及在生产中监控模型的质量。

如果您是 SageMaker 用户,建议使用 SageMaker Python 开发工具包,遵循端到端 ML 教程。要查找开源文档,请参阅Amazon SageMaker Python 开发工具包.

教程概述

本入门教程将向您介绍如何创建 SageMaker 笔记本实例、使用 Conda 环境打开预配置内核的 Jupyter 笔记本以进行机器学习,以及启动 SageMaker 会话以运行端到端的 ML 周期。您将了解如何将数据集保存到与 SageMaker 会话自动配对的默认 Amazon S3 存储桶,向 Amazon EC2 提交 ML 模型的培训作业,以及如何通过 Amazon EC2 托管或批量推理来部署经过培训的模型以进行预测。

本教程明确显示了从 SageMaker 内置模型池中训练 XGBoost 模型的完整 ML 流程。您可以使用美国成人普查数据集,您可以在预测个人收入时评估训练有素的 SageMaker XGBoost 模型的性能。