本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 实时推理
<a name="realtime-endpoints"></a>

 实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker AI 托管服务，并获得可用于推理的终端节点。这些端点是完全托管的，并支持自动扩缩（请参阅[自动缩放 Amazon SageMaker 人工智能模型](endpoint-auto-scaling.md)）。

**Topics**
+ [为实时推理部署模型](realtime-endpoints-deploy-models.md)
+ [调用模型进行实时推理](realtime-endpoints-test-endpoints.md)
+ [端点](realtime-endpoints-manage.md)
+ [托管选项](realtime-endpoints-options.md)
+ [自动缩放 Amazon SageMaker 人工智能模型](endpoint-auto-scaling.md)
+ [实例存储卷](host-instance-storage.md)
+ [验证生产中的模型](model-validation.md)
+ [使用 Clarify 进行在线解释 SageMaker](clarify-online-explainability.md)
+ [使用适配器推理组件微调模型](realtime-endpoints-adapt.md)