注册模型 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

注册模型

您可以使用为模型添加自动扩展Amazon CLI或者 Application Auto Scaling API。首先必须注册模型,然后必须定义自动扩展策略。

使用 Amazon CLI 注册模型

使用 Amazon CLI,您可以根据预定义或自定义的指标来配置自动扩展。

要注册终端节点,请使用具有以下参数的 register-scalable-target Amazon CLI 命令:

  • --service-namespace— 将该值设置为sagemaker.

  • --resource-id— 模型的资源标识符(特别是生产变体)。对于该参数,资源类型为 endpoint,唯一标识符为产品变体的名称。例如,endpoint/MyEndpoint/variant/MyVariant

  • --scalable-dimension— 将该值设置为sagemaker:variant:DesiredInstanceCount.

  • --min-capacity— 此模型的最小实例数。将 min-capacity 设置为至少 1。它必须等于或小于为 max-capacity 指定的值。

  • --max-capacity— Application Auto Scaling 应管理的最大实例数。将 max-capacity 设置为至少 1。它必须等于或大于为 min-capacity 指定的值。

以下示例演示如何注册名为 MyVariant 的模型,该模型动态扩展以具有一个到八个实例:

aws application-autoscaling register-scalable-target \ --service-namespace sagemaker \ --resource-id endpoint/MyEndPoint/variant/MyVariant \ --scalable-dimension sagemaker:variant:DesiredInstanceCount \ --min-capacity 1 \ --max-capacity 8

使用 Application Auto Scaling API 注册模型

要定义模型的扩展限制,请向 Application Auto Scaling 注册模型。Application Auto Scaling 会动态扩展生产变体实例的数量。

要使用 Application Auto Scaling 将模型注册到,请使用RegisterScalableTarget具有以下参数的 Application Auto Scaling API 操作:

  • ServiceNamespace— 将该值设置为sagemaker.

  • ResourceID— 生产变体的资源标识符。对于该参数,资源类型为 endpoint,唯一标识符为变体的名称,例如,endpoint/MyEndPoint/variant/MyVariant

  • ScalableDimension— 将该值设置为sagemaker:variant:DesiredInstanceCount.

  • MinCapacity— 由 Application Auto Scaling 管理的最小实例数。必须将此值设置为至少 1,并且必须等于或小于为 MaxCapacity 指定的值。

  • MaxCapacity— 由 Application Auto Scaling 管理的最大实例数。必须将此值设置为至少 1,并且必须等于或大于为 MinCapacity 指定的值。

以下示例演示如何注册 SageMaker 动态扩展以使用一个到八个实例的生产变体:

POST / HTTP/1.1 Host: autoscaling.us-east-2.amazonaws.com Accept-Encoding: identity X-Amz-Target: AnyScaleFrontendService.RegisterScalableTarget X-Amz-Date: 20160506T182145Z User-Agent: aws-cli/1.10.23 Python/2.7.11 Darwin/15.4.0 botocore/1.4.8 Content-Type: application/x-amz-json-1.1 Authorization: AUTHPARAMS { "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/MyEndPoint/variant/MyVariant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "MinCapacity": 1, "MaxCapacity": 8 }