本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
实时推理
实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker 托管服务,并获得可用于推理的终端节点。这些端点是完全托管的,并支持自动扩缩(请参阅自动缩放 Amazon SageMaker 机型)。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
实时推理非常适合有实时、交互式、低延迟要求的推理工作负载。您可以将模型部署到 SageMaker 托管服务,并获得可用于推理的终端节点。这些端点是完全托管的,并支持自动扩缩(请参阅自动缩放 Amazon SageMaker 机型)。