自动模型评测

您可以在 Studio 中或在自己的代码中使用 fmeval 库创建自动模型评测。Studio 使用向导创建模型评测任务。fmeval 库提供了进一步定制工作流程的工具。

这两种类型的自动模型评估作业都支持使用公开可用的 JumpStart JumpStart 模型以及您之前部署到端点的模型。如果您使用 JumpStart 的是之前未部署的， SageMaker AI 将负责创建必要的资源，并在模型评估任务完成后将其关闭。

要使用来自其他 Amazon 服务的基于文本的 LLM 或外部托管的模型 Amazon，必须使用该fmeval库。

作业完成后，结果会保存在创建作业时指定的 Amazon S3 存储桶中。要了解如何解释结果，请参阅了解模型评测作业的结果。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

创建使用人工的模型评测

在 Studio 中创建自动模型评测任务