

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用控制台配置模型自动扩缩
<a name="endpoint-auto-scaling-add-console"></a>

**要为模型（管理控制台）配置自动扩缩功能**

1. 打开 Amazon A SageMaker I 控制台，网址为[https://console.aws.amazon.com/sagemaker/](https://console.amazonaws.cn/sagemaker/)。

1. 在导航窗格中选择**推理**，然后选择**端点**。

1. 选择端点，然后在**端点运行时设置**中选择变体。

1. 选择 **Configure auto scaling** (配置自动扩展)。

1. 在**配置变量自动扩缩**页面的**变量自动扩缩**中，执行以下操作：

   1. 在**最小实例数**中，键入希望扩展策略保持的最小实例数。至少需要 1 个实例。

   1. 在**最大实例数**中，键入希望扩展策略保持的最大实例数。

1. 对于**内置扩展策略**，请执行以下操作：

   1. 对于**目标指标**，`SageMakerVariantInvocationsPerInstance` 会被自动选择为指标，且无法更改。

   1. 对于**目标值**，请键入模型每分钟每个实例的平均调用次数。要确定该值，请按照[负载测试](endpoint-scaling-loadtest.md)中的准则进行操作。

   1. (可选）对于**横向缩减冷却（秒）**和**横向扩展冷却（秒）**，输入每个冷却周期的时间（秒）。

   1. (可选）如果不想在流量减少时自动扩缩终止实例，请选择**禁用横向缩减**。

1. 选择**保存**。

此过程使用 Application Auto Scaling 将模型注册为可扩展目标。当您注册模型时，Application Auto Scaling 执行验证检查以确保以下内容：
+ 该模型存在
+ 权限足够
+ 您没有注册具有可突增性能实例 (如 T2) 的变体。
**注意**  
SageMaker AI 不支持 T2 等可突发实例的 auto Scaling，因为它们已经允许在工作负载增加的情况下增加容量。有关可突增性能实例的信息，请参阅 [Amazon EC2 实例类型](https://www.amazonaws.cn/ec2/instance-types/)。