

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 了解在 Amazon A SageMaker I 中部署模型和获取推理的选项
<a name="deploy-model-get-started"></a>

为了帮助您开始使用 SageMaker AI 推理，请参阅以下章节，其中说明了在 SageMaker AI 中部署模型和获取推理的选项。[Amazon A SageMaker I 中的推理选项](deploy-model-options.md) 部分可以帮助您确定哪种功能最适合您的推理使用场景。

您可以参阅[资源](inference-resources.md)本节，了解更多疑难解答和参考信息、有助于您入门的博客和示例，以及常见问题 FAQs。

**Topics**
+ [开始前的准备工作](#deploy-model-prereqs)
+ [模型部署步骤](#deploy-model-steps)
+ [Amazon A SageMaker I 中的推理选项](deploy-model-options.md)
+ [用于使用 Amazon A SageMaker I 进行推理的高级终端节点选项](deploy-model-advanced.md)
+ [使用 Amazon A SageMaker I 进行推理的后续步骤](deploy-model-next-steps.md)

## 开始前的准备工作
<a name="deploy-model-prereqs"></a>

以下主题假设您已构建和训练了一个或多个机器学习模型，并已准备好部署它们。您无需在 AI 中训练模型即可在 SageMaker A SageMaker I 中部署模型并获得推论。如果您没有自己的模型，也可以使用 SageMaker AI 的[内置算法或预训练模型](https://docs.amazonaws.cn/sagemaker/latest/dg/algos.html)。

如果您是 SageMaker AI 新手，但还没有选择要部署的模型，请按照 [Amazon A SageMaker I 入门教程中的步骤进行](https://docs.amazonaws.cn/sagemaker/latest/dg/gs.html)操作。使用本教程熟悉 SageMaker AI 如何管理数据科学过程以及它如何处理模型部署。有关模型训练的更多信息，请参阅[训练模型](https://docs.amazonaws.cn/sagemaker/latest/dg/train-model.html)。

有关更多信息、参考和其他示例，请参阅[资源](inference-resources.md)。

## 模型部署步骤
<a name="deploy-model-steps"></a>

对于推理端点，常规工作流包括以下内容：
+ 通过指向 Amazon S3 中存储的模型工件和容器映像，在 A SageMaker I 推理中创建模型。
+ 选择推理选项。有关更多信息，请参阅 [Amazon A SageMaker I 中的推理选项](deploy-model-options.md)。
+ 通过在终端节点后面选择所需的实例类型和实例数量，创建 SageMaker AI Inference 终端节点配置。您可以使用 [Amazon SageMaker 推理推荐器](https://docs.amazonaws.cn/sagemaker/latest/dg/inference-recommender.html)来获取实例类型的建议。对于无服务器推理，您只需根据模型大小提供所需的内存配置。
+ 创建 A SageMaker I 推理端点。
+ 调用您的端点以收到推理作为响应。

下图显示了上述工作流。

![上一段中描述的工作流程显示了如何从 SageMaker AI 中获取推论。](http://docs.amazonaws.cn/sagemaker/latest/dg/images/inference-workflow-flowchart.png)


您可以使用控制 Amazon 台、、 SageMaker Python SDK Amazon CloudFormation 或 Amazon CLI。 Amazon SDKs

要使用批量转换进行批量推理，请指向您的模型构件和输入数据，然后创建批量推理作业。 SageMaker AI 不会托管用于推理的终端节点，而是将您的推断输出到您选择的 Amazon S3 位置。