Amazon SageMaker AI 功能 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon SageMaker AI 功能

Amazon SageMaker AI 包含以下功能。

re:Invent 2024 上推出的新功能

SageMaker AI 包含 re:Invent 2024 发布的以下新功能。

HyperPod 配方

您可以在 Amazon SageMaker HyperPod 中运行配方,也可以将配方作为 SageMaker 训练作业运行。您可以将 HyperPod 训练适配器用作框架来协助您运行端到端训练工作流程。训练适配器基于 NVIDIA NeMo 框架和 Neuronx 分布式训练包构建。

Studio 中的 HyperPod

在 Amazon SageMaker Studio 中,您可以在 HyperPod 集群上启动机器学习工作负载并查看 HyperPod 集群信息。对集群详细信息和硬件指标的更高可见性,有助于团队为预训练或微调工作负载确定合适的候选项。

HyperPod 任务治理

Amazon SageMaker HyperPod 任务治理是一个强大的管理系统,旨在简化资源分配,并确保跨团队和项目高效利用 Amazon EKS 集群的计算资源。HyperPod 任务治理还提供 Amazon EKS 集群可观测性功能,从而实现对集群容量、计算可用性和使用情况、团队分配和利用率以及任务运行和等待时间信息的实时可见性。

Amazon SageMaker 合作伙伴 AI 应用程序

借助 Amazon SageMaker 合作伙伴 AI 应用程序,用户可以访问由行业领先的应用程序提供商构建、发布和分发的生成式人工智能(AI)和机器学习(ML)开发应用程序。合作伙伴 AI 应用程序已通过认证,可在 SageMaker AI 上运行。借助合作伙伴 AI 应用程序,用户可以加快其构建基于基础模型(FM)和传统机器学习模型的解决方案的速度和改进构建此类解决方案的方式,同时不会损害其敏感数据的安全性,这些数据完全保持在可信的安全配置内,并且从不会与第三方共享。

Q 开发者版在 Canvas 中可用

您可以在 Amazon SageMaker Canvas 中使用自然语言与 Amazon Q 开发者版进行聊天,来获取生成式人工智能辅助,从而解决机器学习问题。您可以与 Q 开发者版交谈来讨论机器学习工作流程的步骤,并利用 Canvas 功能,例如数据转换、模型构建和部署。

SageMaker 训练计划

Amazon SageMaker 训练计划是一种计算预留功能,专为在 SageMaker 训练作业和 HyperPod 集群上运行的大规模 AI 模型训练工作负载而设计。它们提供在指定时间表内对高需求 GPU 加速计算资源的可预测访问。您可以指定所需的时间表、持续时间和最大计算资源,而 SageMaker 训练计划会自动管理基础设施设置、工作负载执行和故障恢复。这样,就可以使用可预测的成本模型高效地规划和执行任务关键型 AI 项目。

机器学习环境

SageMaker AI 包括以下机器学习环境。

SageMaker Canvas

一项自动机器学习服务,使没有编码经验的人能够构建模型并使用这些模型进行预测。

代码编辑器

Code Editor 扩展了 Studio,使您可以在基于 Visual Studio Code - Open Source(“Code-OSS”)的环境中编写、测试、调试和运行分析和机器学习代码。

SageMaker 地理空间功能

使用地理空间数据构建、训练和部署机器学习模型。

SageMaker HyperPod

Amazon SageMaker HyperPod 是 SageMaker AI 的一项功能,可在弹性集群上提供始终在线的机器学习环境,您可以运行任何机器学习工作负载来开发大型机器学习模型,例如大语言模型(LLM)和扩散模型。

JupyterLab in Studio

JupyterLab in Studio 提高了 Studio Notebook 的延迟和可靠性

Studio

Studio 是一种运行 ML 工作流的最新网络体验。Studio 提供一套 IDE,包括 Code Editor、新的 Jupyterlab 应用程序、RStudio 和 Studio Classic。

Amazon SageMaker Studio Classic

一体式机器学习环境,您可以在同一应用程序中构建、训练、部署和分析模型。

SageMaker Studio Lab

一项免费服务,让客户能够在基于开源 JupyterLab 的环境中访问 Amazon 计算资源。

RStudio on Amazon SageMaker AI

RStudio on Amazon SageMaker 是 R 的集成开发环境,具有控制体、支持直接代码执行的语法突出显示编辑器以及用于绘制、历史记录、调试和工作区管理的工具。

主要特征

SageMaker AI 按字母顺序包含以下主要功能,但不包括任何 SageMaker AI 前缀。

Amazon Augmented AI

构建人工审核机器学习预测所需的工作流。Amazon A2I 使所有开发人员都能使用人工审核,消除了与构建人工审核系统或管理大量人工审核人员相关的千篇一律的繁重工作。

AutoML 步骤

创建 AutoML 作业以在 Pipelines 中自动训练模型。

SageMaker Autopilot

不了解机器学习的用户可以快速构建分类和回归模型。

批量转换

预处理数据集,在不需要持久终端节点时运行推理,并将输入记录与推理相关联,以帮助解释结果。

SageMaker Clarify

通过检测潜在的偏见来改进机器学习模型,并协助解释模型所做的预测。

使用共享空间进行协作

共享空间由共享的 JupyterServer 应用程序和共享目录组成。Amazon SageMaker AI 域中的所有用户配置文件都可以访问此域中的所有共享空间。

SageMaker Data Wrangler

在 SageMaker Studio 中导入、分析、准备和特征化数据。您可以将 Data Wrangler 集成到机器学习工作流中,以简化数据预处理和特征工程,只需少量甚至不需要编写代码。您还可以添加自己的 Python 脚本和转换来自定义数据准备工作流。

Data Wrangler 数据准备小部件

与您的数据进行交互、探索切实可行的见解并修复数据质量问题。

SageMaker Debugger

在整个训练过程中检查训练参数和数据。自动检测常见错误并向用户发出警报,例如参数值变得太大或太小。

SageMaker Edge Manager

优化边缘设备的自定义模型,创建和管理队列,并在有效的运行时系统中运行模型。

SageMaker Experiments

实验管理和跟踪。您可以使用跟踪的数据重新构建实验,在对等方进行的实验基础上逐步构建,并跟踪模型谱系以进行合规性和审核验证。

SageMaker Feature Store

特征和关联元数据的集中化存储,以便轻松发现和重用特征。您可以创建两种类型的存储,即在线存储和离线存储。在线存储可用于低延迟、实时推理使用案例,离线存储可用于训练和批量推断。

SageMaker Ground Truth

高质量的训练数据集,通过安排工作人员和使用机器学习来创建标注数据集。

SageMaker Ground Truth Plus

一个功能齐全的数据标注功能,可创建高质量的训练数据集,而无需自行构建标注应用程序和管理标签人力。

SageMaker Inference Recommender

获取有关推理实例类型和配置的建议(例如实例计数、容器参数和模型优化),以便使用机器学习模型和工作负载。

推理影子测试

通过将模型服务基础设施的性能与当前部署的基础设施进行比较,评估对模型服务基础设施进行的任何更改。

SageMaker JumpStart

通过精心策划的一键式解决方案、示例笔记本和可部署的预训练模型来了解 SageMaker AI 的特性和功能。您还可以微调模型并进行部署。

SageMaker ML 任务流水线追踪功能

跟踪机器学习工作流的流水线。

SageMaker 建模管线

创建和管理直接与 SageMaker AI 作业集成的机器学习管线。

SageMaker 模型卡

在一个位置记录有关机器学习模型的信息,以便在整个机器学习生命周期中简化管理和报告。

SageMaker 模型控制面板

账户中所有模型的预构建的可视化概览。模型控制面板集成了来自 SageMaker Model Monitor、转换作业、端点、谱系跟踪和 CloudWatch 的信息,以便您能够在一个统一的视图中访问高级模型信息并跟踪模型性能。

SageMaker Model Monitor

监控和分析生产中的模型(端点),以检测数据偏差和模型质量偏差。

SageMaker 模型注册表

用于部署机器学习模型的版本控制、构件和任务流水线追踪功能、审批工作流和跨账户支持。

SageMaker Neo

训练机器学习模型一次,然后在云端和边缘的任何位置运行。

基于笔记本的工作流

将您的 SageMaker Studio 笔记本作为非交互式的计划作业运行。

预处理

分析和预处理数据,处理特征工程问题,并评估模型。

SageMaker 项目

使用 SageMaker 项目通过 CI/CD 创建端到端机器学习解决方案。

强化学习

代理通过其操作获得最大化的长期奖励。

SageMaker 角色管理器

管理员可以使用基于自定义和预配置的角色的 IAM 角色,为常见机器学习活动定义最低权限。

SageMaker 无服务器端点

用于托管机器学习模型的无服务器端点选项。自动横向缩减容量以提供端点流量。无需在端点上选择实例类型或管理扩展策略。

Studio Classic Git 扩展

一个 Git 扩展,供您输入 Git 存储库的 URL、将其克隆到您的环境中、推送更改以及查看提交历史记录。

SageMaker Studio 笔记本

下一代 SageMaker 笔记本,包括 Amazon IAM Identity Center (IAM Identity Center) 集成、快速启动时间和单击共享。

下一代 SageMaker 笔记本,包括较短的启动时间和单击共享。

SageMaker Studio 笔记本和 Amazon EMR

直接从 SageMaker Studio 中轻松发现、连接、创建、终止和管理单个账户和跨账户配置的 Amazon EMR 集群。

SageMaker Training Compiler

在 SageMaker AI 管理的可扩展的 GPU 实例上更快地训练深度学习模型。