本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Amazon A SageMaker I 自定义模型
Amazon SageMaker AI 模型定制功能可将传统上复杂而耗时的定制 AI 模型的过程从长达数月的工作转变为可在几天内完成的简化工作流程。此功能解决了 AI 开发人员所面临的关键挑战,他们需要使用专有数据自定义基础模型,以创建高度差异化的客户体验。本 SageMaker AI step-by-step 指南提供了详细的自定义文档,包括指南和高级配置选项。有关 Nova 模型定制的简要概述,请参阅 Amazon Nova 用户指南 SageMaker中的自定义和微调。
该功能包括一个了解自然语言要求的全新引导式用户界面,以及一套全面的高级模型定制技术,所有这些技术均由无服务器基础架构提供支持,从而消除了管理计算资源的运营开销。无论您是在构建法律研究应用程序、增强客户服务聊天机器人,还是开发特定领域的人工智能代理,此功能都可以加快您从生产部署到生产部署的速度。 proof-of-concept
由 Amazon Bedrock 评估提供支持的模型定制功能可以在您的地理区域Amazon Web Services 区域内安全地传输数据以进行处理。欲了解更多信息,请访问 Amazon Bedrock 评估文档。
重要概念
无服务器训练
一种完全托管的计算基础架构,可消除所有基础架构的复杂性,使您能够完全专注于模型开发。这包括根据模型大小和训练要求自动配置 GPU 实例(P5、p4de、p4d、G5)、预先优化的训练配方(其中包含每种自定义技术的最佳实践)、通过用户界面访问的实时指标和日志进行实时监控,以及在训练完成后自动清理资源以优化成本。
模型定制技巧
一套全面的高级方法,包括监督微调 (SFT)、直接偏好优化 (DPO)、可验证奖励的强化学习 (RLVR) 和带人工智能反馈的强化学习 (RLAIF)。
自定义模型
基础模型的专用版本,通过根据您自己的数据进行训练来适应特定用例,从而生成的 AI 模型保留了原始基础模型的一般功能,同时添加了根据您的要求量身定制的特定领域知识、术语、风格或行为。
AI 模型自定义资产
在模型定制过程中用于训练、完善和评估自定义模型的资源和工件。这些资产包括用于微调基础模型以学习特定行为、知识或风格的训练示例(提示响应对、特定领域文本或带标签的数据)的集合,以及评估器,它们是通过奖励函数(基于代码的逻辑,根据特定标准对模型输出进行评分,用于 RLVR 训练和自定义记分手评估)或奖励提示(用于奖励提示)来评估和提高模型性能的机制(基于代码的逻辑,用于RLVR训练和自定义评分员评估)指导法学硕士判断模型响应质量的自然语言指令,用于 RLAIF 训练和 LLM-as-a-judge评估)。
模型包组
一个集合容器,用于跟踪训练作业中所有记录的模型,为模型版本及其血统提供集中位置。
已记录的模型
SageMaker AI 在运行无服务器训练作业时创建的输出。这可以是经过微调的模型(成功作业)、检查点(带有检查点的失败作业)或关联的元数据(没有检查点的失败作业)。
注册型号
已标记为用于正式跟踪和治理目的的记录模型,可实现完整的血统和生命周期管理。
血统
在 SageMaker AI 和 Amazon Bedrock 上自动捕获的训练作业、输入数据集、输出模型、评估作业和部署之间的关系。
跨账号共享
能够使用 Resource Acc Amazon ess Manager (RAM) 跨Amazon账户共享模型、数据集和赋值器,同时保持完全的谱系可见性。