将模型部署到端点

在 Amazon SageMaker Canvas 中，您可以将模型部署到终端节点以进行预测。 SageMaker AI 为您提供了机器学习基础架构，让您可以将模型托管在带有您选择的计算实例的终端节点上。然后，您可以调用端点（发送预测请求）并从模型中获取实时预测。借助此功能，您可以在生产环境中使用模型来响应传入的请求，还可以将模型与现有应用程序和工作流集成。

要开始操作，您应该先拥有想要部署的模型。您可以部署自己构建的自定义模型版本、Amazon SageMaker JumpStart 基础模型和经过微调 JumpStart 的基础模型。有关在 Canvas 中构建模型的更多信息，请参阅自定义模型的工作原理。有关 Canvas 中 JumpStart基础模型的更多信息，请参阅C SageMaker anvas 中的生成式 AI 基础模型。

查看以下权限管理部分，然后在部署模型部分开始创建新部署。

权限管理

默认情况下，您有权将模型部署到 SageMaker AI Hosting 终端节点。 SageMaker AI 通过策略为所有新的和现有的 Canvas 用户配置文件授予这些权限，该AmazonSageMakerCanvasFullAccess策略附加到托管 Canvas 应用程序的 A SageMaker I 域的 Amazon IAM 执行角色。

如果您的 Canvas 管理员正在设置新的域或用户配置文件，则当他们设置域并按照中的先决条件说明进行操作时设置 Amazon C SageMaker anvas 的先决条件， SageMaker AI 会通过 “启用直接部署 Canvas 模型” 选项开启模型部署权限，该选项默认处于启用状态。

Canvas 管理员还可以在用户配置文件级别管理模型部署权限。例如，如果管理员不想在设置域时向所有用户配置文件授予模型部署权限，他们可以在创建域后向特定用户授予权限。

以下过程说明如何修改特定用户配置文件的模型部署权限：

打开 SageMaker AI 控制台，网址为https://console.aws.amazon.com/sagemaker/。
在左侧导航窗格中，选择管理员配置。
在管理员配置下，选择域。
从域列表中，选择用户配置文件的域。
在域详细信息页面上，选择用户配置文件选项卡。
选择您的用户配置文件。
在用户配置文件页面，选择添加配置选项卡。
在 Canvas 部分中，选择编辑。
在 ML Ops 配置部分，打开启用 Canvas 模型的直接部署开关，以启用部署权限。
选择提交以保存对域设置的更改。

用户配置文件现在应该具有模型部署权限。

授予域或用户配置文件权限后，确保用户退出其 Canvas 应用程序并重新登录以应用权限更改。

部署模型

要开始部署模型，您可以在 Canvas 中创建一个新的部署，并指定要部署的模型版本以及 ML 基础设施，例如要用于托管模型的计算实例的类型和数量。

Canvas 会根据您的模型类型建议默认类型和实例数量，或者您可以在亚马逊 SageMaker 定价页面上详细了解各种 A SageMaker I 实例类型。您的终端节点处于活动状态时，将根据 SageMaker AI 实例的定价向您收费。

部署 JumpStart 基础模型时，您还可以选择指定部署时间的长度。您可以无限期地将模型部署到端点（这意味着端点一直处于活动状态，直到您删除部署）。或者，如果您只需要在短时间内使用终端节点并希望降低成本，则可以将模型部署到终端节点指定时间，之后 SageMaker AI 会为您关闭终端节点。

注意

如果您要在指定时间内部署模型，请在端点持续期间保持登录 Canvas 应用程序。如果您退出或删除应用程序，则 Canvas 无法在指定时间关闭端点。

将模型部署到 SageMaker AI Host ing 实时推理终端节点后，您可以通过调用该终端节点开始进行预测。

从 Canvas 应用程序部署模型有几种不同的方法。您可以通过以下任一方法访问模型部署选项：

在 Canvas 应用程序的我的模型页面上，选择要部署的模型。然后，在模型的版本页面中，选择模型版本旁边的更多选项图标 ( )，然后选择部署。
在模型版本的详细信息页面的分析选项卡上，可以选择部署选项。
在模型版本的详细信息页面的预测选项卡上，选择页面顶部的更多选项图标 ( )，然后选择部署。
在 Canvas 应用程序的 ML Ops 页面上，选择部署选项卡，然后选择创建部署。
对于 JumpStart 基础模型和经过微调的基础模型，请转到 Canvas 应用程序的Ready-to-use 模型页面。选择生成、提取和汇总内容。然后，找到要部署 JumpStart 的基础模型或经过微调的基础模型。选择模型，然后在模型的聊天页面上选择部署按钮。

所有这些方法都会打开部署模型侧面板，您可在此指定模型的部署配置。要通过此面板部署模型，请执行以下操作：

（可选）如果您从 ML Ops 页面创建部署，则可以选定选择模型和版本。使用下拉菜单选择要部署的模型和模型版本。
在部署名称字段中输入名称。
（仅适用于 JumpStart 基础模型和经过微调的基础模型）选择部署长度。选择无限期，使端点处于活动状态，直到关闭为止；或选择指定时长，然后输入您希望端点保持活动状态的时间段。
对于实例类型， SageMaker AI 会检测适合您的模型的默认实例类型和编号。不过，您可以更改要用于托管模型的实例类型。

注意
如果您的 Amazon 账户上所选实例类型的实例配额已用完，则可以申请增加配额。有关默认配额以及如何申请增加配额的更多信息，请参阅Amazon 通用参考指南中的 Amazon SageMaker AI 终端节点和配额。
对于实例计数，您可以设置用于终端节点的活跃实例数量。 SageMaker AI 会检测到适合您的型号的默认数字，但您可以更改此数字。
如果您已准备好部署模型，请选择部署。

现在，您的模型应该已部署到端点。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

在 SageMaker AI 模型注册表中注册模型版本

查看部署