实时推理 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

实时推理

实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker 托管服务,并获得可用于推断的端点。这些端点是完全托管的,并支持自动扩缩(请参阅自动扩缩 Amazon SageMaker 模型)。