View a markdown version of this page

用于使用 Amazon A SageMaker I 进行推理的高级终端节点选项 - 亚马逊 SageMaker AI

用于使用 Amazon A SageMaker I 进行推理的高级终端节点选项

借助实时推理，您可以使用以下高级推理选项进一步优化性能和成本：

Multi-model 端点：如果您的多个模型使用相同的框架，并且可以共享一个容器，请使用此选项。此选项可通过提高端点利用率和减少部署开销来帮助您优化成本。
Multi-container 端点：如果您的多个模型使用不同的框架，并且需要各自的容器，请使用此选项。您可以获得 Endpoint Multi-Model s 的许多好处，并且可以部署各种框架和模型。
串行推理管道：如果您要在端点后面托管带有预处理和后处理逻辑的模型，请使用此选项。推理管道完全由 SageMaker AI 管理，延迟更低，因为所有容器都托管在相同的 Amazon EC2 实例上。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

推理选项

后续步骤