从已部署的服务（Amazon SageMaker SDK）请求推断

使用以下代码示例，根据用于训练模型的框架，通过已部署的服务请求推理。不同框架的代码示例类似。主要区别在于 TensorFlow 要求application/json作为内容类型。

PyTorch 和 MXNet

如果您使用的是 PyTorch v1.4 或更高版本或 MXNet 1.7.0 或更高版本，并且拥有亚马逊 A SageMaker I 终端节点InService，则可以使用适用于 Python 的 AI SageMaker 开发工具predictor包进行推理请求。

注意

API 因适用于 Python SageMaker 的人工智能开发工具包版本而异：

对于版本 1.x，请使用 RealTimePredictor 和 Predict API。
对于版本 2.x，请使用 Predictor 和 Predict API。

以下代码示例显示了如何使用它们发送图像 APIs 以进行推理：

TensorFlow

以下代码示例展示了如何使用 SageMaker Python SDK API 发送用于推理的图像：


from sagemaker.predictor import Predictor
from PIL import Image
import numpy as np
import json

endpoint = 'insert the name of your endpoint here'

# Read image into memory
image = Image.open(input_file)
batch_size = 1
image = np.asarray(image.resize((224, 224)))
image = image / 128 - 1
image = np.concatenate([image[np.newaxis, :, :]] * batch_size)
body = json.dumps({"instances": image.tolist()})
    
predictor = Predictor(endpoint)
inference_response = predictor.predict(data=body)
print(inference_response)

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

请求推理

通过已部署服务 (Boto3) 请求推理