实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker 托管服务,并获得可用于推断的端点。这些端点是完全托管的,并支持自动扩缩(请参阅自动扩缩 Amazon SageMaker 模型)。
Javascript 在您的浏览器中被禁用或不可用。
要使用 Amazon Web Services 文档,必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。