在 Studio 中使用基础模型 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Studio 中使用基础模型

您可以直接通过 Amazon SageMaker Studio 用户界面微调、部署和评估公开和专有 JumpStart 基础模型。

重要

截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用更新后的 Studio 体验。有关使用 Studio Classic 应用程序的信息,请参见亚马逊 SageMaker Studio 经典版

在 Amazon SageMaker Studio 中,通过左侧面板上的主页或主页菜单打开 JumpStart 登录页面。这将打开SageMaker JumpStart登录页面,您可以在其中浏览模型中心并搜索模型。

  • 在 “主页” 页面中,JumpStart在 “预构建和自动解决方案” 窗格中进行选择。

  • 从左侧面板的 “主页” 菜单中导航到该JumpStart节点。

有关开始使用 Amazon SageMaker Studio 的更多信息,请参阅亚马逊 SageMaker Studio

在 Studio 的SageMaker JumpStart登录页面上,您可以浏览公开模型和专有模型提供商提供的模型中心。您可以使用搜索栏找到特定的集线器或型号。在每个模型中心中,您可以直接搜索模型,按最喜欢次数、下载次数最多最近更新次数排序,或者根据提供的模型任务列表进行筛选。选择一个型号以查看其模型详细信息卡。在模型详情卡片的右上角,选择微调部署评估,开始分别完成微调、部署或评估工作流程。请注意,并非所有模型都可用于微调或评估。

在 Studio 中微调基础模型

Fine-tuning 无需从头开始训练,即可在新数据集中训练预先训练的模型。这个过程也称为转移学习,可以使用较小数据集和较短的训练时间生成准确模型。要微调 JumpStart基础模型,请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息,请参阅 JumpStart 在 Studio 中打开并使用。导航到您选择的模型详情卡片后,选择右上角的训练。请注意,并非所有型号都提供微调。

重要

某些基础模型要求在微调之前明确接受最终用户许可协议 (EULA)。有关更多信息,请参阅 亚马逊 SageMaker Studio 接受最终用户许可协议

模型设置

在 Amazon SageMaker Studio 中使用预训练 JumpStart 的基础模型时,默认情况下会填充模型构件位置(Amazon S3 URI)。要编辑默认 Amazon S3 URI,请选择输入模型构件位置。并非所有模型都支持更改模型构件的位置。

数据设置

数据字段中,提供指向您的训练数据集位置的 Amazon S3 URI。默认 Amazon S3 URI 指向一个示例训练数据集。要编辑默认 Amazon S3 URI,请选择输入训练数据集并更改 URI。请务必查看 Amazon SageMaker Studio 中的模型详情卡,了解有关格式化训练数据的信息。

超参数

您可以自定义用于微调模型的训练作业的超参数。每个可微调模型的可用超参数因模型而异。

以下超参数在模型中很常见:

  • 纪元 – 一个纪元是遍历整个数据集的一个周期。通过多个时间间隔完成一个批次,通过多个批次最终完成一个纪元。系统运行多个纪元,直到模型的准确性达到可接受的水平,或者说当错误率降至可接受的水平以下时。

  • 学习率 – 各个纪元之间应该变化的值的数量。随着模型的优化,其内部权重将被调整,并检查错误率以确定模型是否有所改善。典型的学习率为 0.1 或 0.01,其中 0.01 是一个小得多的调整,可能会导致训练需要很长时间才能收敛,而 0.1 则要大得多,可能会导致训练过度。这是在训练模型时可能会调整的主要超参数之一。请注意,对于文本模型,小得多的学习率(BERT 为 5e-5)可以生成更准确的模型。

  • 批次大小 – 对于每个间隔,从数据集中选择的用来发送到 GPU 的记录数,以进行训练。

查看 Studio UI 中模型详细信息卡中的工具提示和其他信息,详细了解特定于您选择的模型的超参数。

有关可用超参数的更多信息,请参阅通常支持的微调超参数

部署

为您的训练作业指定训练实例类型和输出构件位置。在微调 Studio 用户界面时,您只能从与所选模型兼容的实例中进行选择。默认输出项目位置是 SageMaker 默认存储桶。要更改输出对象的位置,请选择输入输出对象位置并更改 Amazon S3 URI。

安全性

指定要用于训练任务的安全设置,包括 SageMaker 用于训练模型的 IAM 角色、您的训练作业是否应连接到虚拟私有云 (VPC) 以及用于保护数据的任何加密密钥。

其他信息

在 “其他信息” 字段中,您可以编辑训练作业名称。您还可以以键值对的形式添加和删除标签,以帮助组织和分类微调训练作业。

为您的微调配置提供信息后,选择提交。如果您选择微调的预训练基础模型要求在培训之前明确同意最终用户许可协议 (EULA),则会在弹出窗口中提供最终用户许可协议 (EULA)。要接受 EULA 的条款,请选择 “接受”。在下载或使用模型之前,您有责任查看和遵守任何适用的许可证条款,并确保您的使用案例可以接受这些条款。

在 Studio 中部署基础模型

要部署 JumpStart 基础模型,请导航到 Studio 用户界面中的模型详细信息卡。有关如何在 Studio JumpStart 中打开的更多信息,请参阅 JumpStart 在 Studio 中打开并使用。导航到您选择的模型详情页面后,选择 Studio 用户界面右上角的 “部署”。然后,按照使用 SageMaker Studio 部署模型中的步骤进行操作。

重要

某些基础模型要求在部署之前明确接受最终用户许可协议 (EULA)。有关更多信息,请参阅 亚马逊 SageMaker Studio 接受最终用户许可协议

在 Studio 中评估基础模型

亚马逊 SageMaker JumpStart 已与 Studio 中的 Cl SageMaker arify 基础模型评估 (FME) 集成。如果 JumpStart 模型具有内置评估功能,则可以在 JumpStart Studio 用户界面中模型详情页面的右上角选择评估。有关更多信息,请参阅评估基础模型