部署模型 - 亚马逊 SageMaker AI

部署模型

要将 Amazon SageMaker Neo 编译的模型部署到 HTTPS 终端节点，您必须使用 Amazon A SageMaker I 托管服务为该模型配置和创建终端节点。目前，开发人员可以使用亚马逊 SageMaker APIs 在 ml.c5、ml.c4、ml.m5、ml.m4、ml.p3、ml.p2 和 ml.inf1 实例上部署模块。

对于 Inferentia 和 Trainium 实例，需要专门针对这些实例对模型进行编译。不保证为其他实例类型编译的模型能够与 Inferentia 或 Trainium 实例配合使用。

部署编译的模型时，您需要为用于编译的目标使用相同的实例。这将创建可用于执行推断的 SageMaker AI 终端节点。您可以使用以下任一方法部署 Neo 编译模型：适用于 Python 的亚马逊 A SageMaker I SDK、适用于 P ython 的软件开发工具包 (Amazon Command Line InterfaceBoto3) 和 AI 控制台。SageMaker

注意

要使用 Amazon CLI控制台或 Boto3 部署模型，请参阅 Neo 推理容器镜像，为主容器选择推理图像 URI。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

支持的实例类型和框架

先决条件