本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
什么是 Amazon SageMaker?
Amazon SageMaker 是一项完全托管的机器学习服务。借助 SageMaker,数据科学家和开发人员可以快速、轻松地构建和训练机器学习模型,然后直接将模型部署到生产就绪托管环境中。它提供了一个集成的 Jupyter 编写 Notebook 实例,供您轻松访问数据源以便进行探索和分析,因此您无需管理服务器。此外,它还可以提供常见的机器学习算法,这些算法经过了优化,可以在分布式环境中高效处理非常大的数据。借助对自带算法和框架的原生支持,SageMaker 可以提供灵活并且适合具体工作流程的分布式训练选项。通过在 SageMaker Studio 或 SageMaker 控制台中单击几下鼠标按钮来启动模型,以将模型部署到安全的、可扩展的环境中。训练和托管按使用分钟数计费,没有最低费用,也不需要前期承诺。
本指南包括有关 SageMaker 功能的信息和教程。有关更多信息,请参阅Amazon SageMaker 开发人员资源
主题
Amazon SageMaker 功能
Amazon SageMaker 包括以下功能:
- SageMaker Studio
-
一体式机器学习环境,您可以在同一应用程序中构建、训练、部署和分析模型。
- SageMaker 模型注册表
-
用于部署机器学习模型的版本控制、工件和世系跟踪、审批工作流程以及跨账户支持。
- SageMaker 项目
-
使用 SageMaker 项目使用 CI/CD 创建端到端机器学习解决方案。
- SageMaker 模型构建管道
-
创建和管理与 SageMaker 作业直接集成的机器学习管道。
- SageMaker ML 世系追踪
-
跟踪机器学习工作流的血统。
- SageMaker Data Wrangler
-
在 SageMaker Studio 中导入、分析、准备和特征数据。您可以将 Data Wrangler 集成到机器学习工作流程中,以简化和简化数据预处理和功能工程,只需几乎没有编码即可。您还可以添加您自己的 Python 脚本和转换以自定义数据准备工作流程。
- SageMaker Feature Store
-
集中存储要素和关联元数据,因此可以轻松发现和重复使用要素。您可以创建两种类型的商店,一种是在线或离线商店。在线商店可用于低延迟、实时推理用例,离线商店可用于训练和批量推断。
- SageMaker JumpStart
-
通过精心策划的一键式解决方案、例如笔记本电脑和可部署的预训练模型了解 SageMaker 的特性和功能。您还可以微调模型并部署这些模型。
- SageMaker 澄清
-
通过检测潜在的偏见来改进机器学习模型,并帮助解释模型所做的预测。
- SageMaker Edge 管理器
-
优化边缘设备的自定义模型,创建和管理队列,并在有效的运行时间运行模型。
- SageMaker Ground Truth
-
高质量的训练数据集,它们通过使用工作人员和机器学习来创建标记数据集。
- Amazon Augmented AI
-
构建人工审查机器学习预测所需的工作流程。Amazon A2I 为所有开发人员带来人工审核,消除了与构建人工审核系统或管理大量人工审核人员相关的千篇一律的繁重工作。
- SageMaker Studio 笔记本
-
下一代 SageMaker 笔记本电脑,其中包括Amazon IAM Identity Center (successor to Amazon Single Sign-On)(IAM Identity Center) 集成、快速的启动时间和单击共享。
下一代 SageMaker 笔记本,包括较短的启动时间和单击共享。
- SageMaker 实验
-
实验管理和跟踪。您可以使用跟踪的数据重新构建实验,在对等方进行的实验基础上逐步构建,并跟踪模型谱系以进行合规性和审核验证。
- SageMaker 调试器
-
在整个训练过程中检查训练参数和数据。自动检测常见错误并向用户发出警报,例如参数值变得太大或太小。
- SageMaker Autopilot
-
不了解机器学习的用户可以快速构建分类和回归模型。
- SageMaker 模型监控器
-
监控和分析生产中的模型(终端节点),以检测数据偏差和模型质量偏差。
- SageMaker Neo
-
训练机器学习模型一次,然后在云端和边缘的任何位置运行。
- SageMaker Elastic Inference
-
提高吞吐量并减少获取实时推理的延迟。
- 强化学习
-
代理通过其操作获得最大化的长期奖励。
- 预处理
-
分析和预处理数据,处理功能工程问题,并评估模型。
- 批量转换
-
预处理数据集,在不需要持久终端节点时运行推理,并将输入记录与推理相关联,以帮助解释结果。
Amazon SageMaker 定价
与其他一样Amazon使用 Amazon SageMaker 时,您无需签订合同或承诺最低使用量。有关使用 SageMaker 的成本的更多信息,请参阅SageMaker 定价
您是首次接触 Amazon SageMaker 的用户吗?
如果您是首次接触 SageMaker 的用户,我们建议您执行以下操作:
-
ReadAmazon SageMaker 的工作原理— 此部分概述了 SageMaker,说明了主要概念,并介绍了使用 SageMaker 构建 AI 解决方案时涉及的核心组件。我们建议您按所呈现的顺序阅读本主题。
-
设置 Amazon SageMaker 先决条件— 此部分介绍如何设置Amazonaccount.
-
Amazon SageMaker Autopilot 通过自动执行机器学习任务以简化机器学习体验。如果您不熟悉 SageMaker,它提供了最简单的学习路径。它还用作一种极佳的 ML 学习工具,它对为每个自动 ML 任务生成的笔记本提供代码可见性。有关其功能的简介,请参阅使用亚马逊自动开发模型 SageMaker Autopilot。为了开始构建、训练和部署机器学习模型,Autopilot 提供了:
-
开始使用 Amazon SageMaker— 此部分将指导您使用 SageMaker Studio 或 SageMaker 控制台和 SageMaker API 训练您的第一个模型。您可以使用 SageMaker 提供的训练算法。
-
探索其他主题 – 根据您的需求,执行以下操作:
-
提交 Python 代码以使用深度学习框架进行训练— 在 SageMaker 中,您可以使用您自己的训练脚本来训练模型。有关信息,请参阅将 Machine Learning 框架、Python 和 R 与 Amazon SageMaker 结合使用。
-
直接从 Apache Spark 中使用 SageMaker— 有关信息,请参阅将 Apache Spark 与 Amazon SageMaker 结合使用.
-
使用 SageMaker 训练和部署自己的自定义算法— 使用 Docker 包装您的自定义算法,以便在 SageMaker 中训练和/或部署这些算法。要了解 SageMaker 如何与 Docker 容器交互以及 SageMaker 对 Docker 镜像的要求,请参阅将 Docker 容器用于 SageMaker.
-
-
查看API 参考— 此部分描述 SageMaker API 操作。
Amazon SageMaker 的工作原理
SageMaker 是一项完全托管的服务,可让您快速、轻松地将基于机器学习的模型集成到您的应用程序中。本部分概述了机器学习并解释 SageMaker 的工作原理。如果您是首次接触 SageMaker 的用户,我们建议您按顺序阅读以下部分: