使用 JumpStartModel 类部署公开可用的基础模型 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 JumpStartModel 类部署公开可用的基础模型

您只需使用几行代码即可将内置算法或预训练模型部署到 SageMaker AI 端点 SageMaker Python SDK。

  1. 首先,在内置算法与预训练模型表中找到所选模型的模型 ID。

  2. 使用模型 ID 将您的模型定义为 JumpStart 模型。

    from sagemaker.jumpstart.model import JumpStartModel model_id = "huggingface-text2text-flan-t5-xl" my_model = JumpStartModel(model_id=model_id)
  3. 使用 deploy 方法自动部署模型进行推理。在本示例中,我们使用来自 FLAN-T5 XL 型号 Hugging Face.

    predictor = my_model.deploy()
  4. 然后,您就可以使用 predict 方法对已部署的模型进行推理。

    question = "What is Southern California often abbreviated as?" response = predictor.predict(question) print(response)
注意

此示例使用的基础模型 FLAN-T5 XL 适用于各种文本生成使用场景,包括问题解答、摘要、聊天机器人创建等。有关模型使用场景的更多信息,请参阅 可用的基础模型

有关该JumpStartModel 类及其参数的更多信息,请参见JumpStartModel

检查默认实例类型

在使用 JumpStartModel 类对预训练模型进行部署时,您可以选择包含特定的模型版本或实例类型。所有 JumpStart 模型都有默认的实例类型。使用以下代码读取默认部署实例类型:

from sagemaker import instance_types instance_type = instance_types.retrieve_default( model_id=model_id, model_version=model_version, scope="inference") print(instance_type)

使用instance_types.retrieve()方法查看给定 JumpStart 模型的所有支持的实例类型。

使用推理组件将多个模型部署到共享端点

推理组件是一个 SageMaker AI 托管对象,可用于将一个或多个模型部署到终端节点,以提高灵活性和可扩展性。您必须将 JumpStart 模型更改endpoint_type为 inference-component-based而不是基于模型的默认端点。

predictor = my_model.deploy( endpoint_name = 'jumpstart-model-id-123456789012', endpoint_type = EndpointType.INFERENCE_COMPONENT_BASED )

有关使用推理组件创建端点和部署 SageMaker AI 模型的更多信息,请参阅多种模式的资源共享利用

检查有效的输入和输出推理格式

要检查有效的数据输入和输出格式以进行推理,您可以使用 SerializersDeserializers 类中的 retrieve_options() 方法。

print(sagemaker.serializers.retrieve_options(model_id=model_id, model_version=model_version)) print(sagemaker.deserializers.retrieve_options(model_id=model_id, model_version=model_version))

检查支持的内容和接受类型

同样,您也可以使用 retrieve_options() 方法来检查模型支持的内容和接受类型。

print(sagemaker.content_types.retrieve_options(model_id=model_id, model_version=model_version)) print(sagemaker.accept_types.retrieve_options(model_id=model_id, model_version=model_version))

有关实用程序的更多信息,请参阅实用工具 APIs