本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon 入门 SageMaker 笔记本实例
机器学习 (ML) 从业者使用 Amazon 的最佳方法之一 SageMaker 是使用训练和部署 ML 模型 SageMaker 笔记本实例。这些区域有: SageMaker 笔记本实例通过在 Amazon Elastic Compute Cloud (Amazon EC2) 上启动 Jupyter 服务器以及通过以下软件包提供预配置的内核,帮助创建环境:Amazon SageMaker Python 开发工具包,Amazon SDK for Python (Boto3)、Amazon Command Line Interface(Amazon CLI)、Conda、Pandas、深度学习框架库以及其他用于数据科学和机器学习的图书馆。
使用的 Machine Learning SageMaker Python 开发工具包
训练、验证、部署和评估中的 ML 模型 SageMaker 笔记本实例,请使用 SageMaker Python 开发工具包。这些区域有: SageMaker Python 开发工具包摘要Amazon SDK for Python (Boto3)和 SageMaker API 操作。它使您能够与其他人集成并协调其他Amazon服务,例如用于保存数据和模型构件的 Amazon Simple Storage Service (Amazon S3)、用于导入和维护 ML 模型的 Amazon Elastic Compute Cloud (Amazon EC2)。
您也可以利用 SageMaker 可帮助您处理完整机器学习周期的每个阶段的各个阶段的功能:数据标签、数据预处理、模型训练、模型部署、预测性能评估以及监控生产中模型的质量。
如果您是第一次 SageMaker 用户,我们建议你使用 SageMaker Python SDK,遵循 end-to-end ML 教程。要查找开源文档,请参阅亚马逊 SageMaker Python 开发工具包
教程概述
本入门教程将引导您完成如何创建 SageMaker notebook 实例,打开一个带有预配置内核的 Jupyter 笔记本,并使用 Conda 环境进行机器学习,然后启动 SageMaker 要运行的会话 end-to-end ML 循环。您将了解如何将数据集保存到与 SageMaker 会话自动配对的默认 Amazon S3 存储桶,向 Amazon EC2 提交 ML 模型的培训作业,以及通过 Amazon EC2 托管或批量推断来部署训练模型以进行预测。
本教程明确显示了从 SageMaker 内置模型池。您可以使用美国成人普查数据集
-
SageMaker XGBoost— 该XGBoost
模型适用于 SageMaker 环境并预先配置为 Docker 容器。SageMaker 提供了一套内置算法准备好使用 SageMaker 功能。要了解有关哪些 ML 算法适应 SageMaker 的更多信息,请参阅选择算法和使用 Amazon SageMaker 内置算法. 对于 SageMaker 内置算法 API 操作,请参阅第一方算法 中的亚马逊 SageMaker Python 开发工具包 . -
成人普查数据集
— 来自1994 年普查局数据库 由 Ronny Kohavi 和 Barry Becker(数据挖掘和可视化,硅图形)。这些区域有: SageMaker XgBoost 模型是使用此数据集进行训练的,以预测个人年收入是否超过 50,000 美元或更少。
主题