注册模型 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

注册模型

您可以使用 AWS CLI 或 Application Auto Scaling API 为模型添加自动扩展。首先必须注册模型,然后必须定义自动扩展策略。

使用 AWS CLI 注册模型

使用 AWS CLI,您可以根据预定义或自定义的指标来配置自动扩展。

要注册终端节点,请使用具有以下参数的 register-scalable-target AWS CLI 命令:

  • --service-namespace — 将该值设置为 sagemaker

  • --resource-id — 模型的资源标识符(特别是生产变体)。对于该参数,资源类型为 endpoint,唯一标识符为产品变体的名称。例如:endpoint/MyEndpoint/variant/MyVariant

  • --scalable-dimension — 将该值设置为 sagemaker:variant:DesiredInstanceCount

  • --min-capacity — 此模型的最小实例数。将 min-capacity 设置为至少 1。它必须等于或小于为 max-capacity 指定的值。

  • --max-capacity — Application Auto Scaling 应管理的最大实例数。将 max-capacity 设置为至少 1。它必须等于或大于为 min-capacity 指定的值。

以下示例演示如何注册名为 MyVariant 的模型,该模型动态扩展以具有一个到八个实例:

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/MyEndPoint/variant/MyVariant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

使用 Application Auto Scaling API 注册模型

要定义模型的扩展限制,请将模型注册到 Application Auto Scaling。Application Auto Scaling 动态扩展生产变体实例的数量。

要向 Application Auto Scaling 注册模型,请使用具有以下参数的 RegisterScalableTarget Application Auto Scaling API 操作:

  • ServiceNamespace — 将该值设置为 sagemaker

  • ResourceID — 生产变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称,例如,endpoint/MyEndPoint/variant/MyVariant

  • ScalableDimension — 将该值设置为 sagemaker:variant:DesiredInstanceCount

  • MinCapacity — 由 Application Auto Scaling 管理的最小实例数。必须将此值设置为至少 1,并且必须等于或小于为 MaxCapacity 指定的值。

  • MaxCapacity — 由 Application Auto Scaling 管理的最大实例数。必须将此值设置为至少 1,并且必须等于或大于为 MinCapacity 指定的值。

以下示例说明如何注册 SageMaker 生产变体,该变体动态扩展以使用一个到八个实例:

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndPoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }