模型评测笔记本教程

本节提供以下笔记本教程，其中包括示例代码和说明：

其他笔记本

fmeval GitHub 目录包含以下其他示例笔记本：

bedrock-claude-factual-knowledge.ipnyb — 评估在亚马逊 Bed rock 上托管的 Anthropic Claude 2 模型以获取事实知识。
byo-model-outputs.ipynb — 评估托管的 Falcon 7b 模型 JumpStart 以获取事实知识，在该模型中，您可以自带模型输出，而不是向模型发送推理请求。
custom_model_runner_chat_gpt.ipnyb：评估托管在 Hugging Face 上的自定义 ChatGPT 3.5 模型的事实知识。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

使用 fmeval 库

评估 JumpStart 模型是否能立即产生陈规定型观念