编辑扩展策略 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

编辑扩展策略

您可以使用编辑自动扩展策略Amazon Web Services Management Console,Amazon CLI,或者 Application Auto Scaling API。

缩减

在无流量时横向缩减:如果变体的流量变为零, SageMaker 自动扩展到指定的最小实例数。在本例中, SageMaker 发出值为零的指标。最小实例数必须为 1 或更高。

禁用缩减活动

您可以禁用缩减活动以禁止目标跟踪扩展策略配置缩减变体。禁用缩减活动将禁止扩展策略删除实例,同时仍允许它根据需要创建副本。

要对模型启用或禁用缩减活动,请为 DisableScaleIn 指定一个布尔值。有关 DisableScaleIn 的更多信息,请参阅 Application Auto Scaling API 参考 中的 TargetTrackingScalingPolicyConfiguration

以下是扩展策略的目标跟踪配置示例,其中扩展策略将扩展而不缩减。在此配置中,SageMakerVariantInvocationsPerInstance 预定义指标将基于模型所在的所有实例上平均 70 次调用(推理请求)进行扩展。该配置还禁用扩展策略的缩减活动。

{ "TargetValue": 70.0, "PredefinedMetricSpecification": { "PredefinedMetricType": "SageMakerVariantInvocationsPerInstance" }, "DisableScaleIn": true }

扩展

要手动进行扩展,请调整最小容量。您可以使用控制台更新此值。或者,使用Amazon CLI使用--min-capacity参数,或使用 Application Auto Scaling APIMinCapacity参数。

禁用扩展活动

要防止扩展,请调整最大容量。您可以使用控制台更新此值。或者,使用Amazon CLI使用--max-capacity参数,或使用 Application Auto Scaling APIMaxCapacity参数。

编辑扩展策略(控制台)

要使用 Amazon Web Services Management Console编辑扩展策略,请使用与使用控制台配置模型自动扩展相同的过程。

编辑扩展策略 (Amazon CLI或 Application Auto Scaling API)

您可以使用 Amazon CLI 或 Application Auto Scaling API 按照与应用扩缩策略相同的方式编辑扩缩策略:

  • 在使用 Amazon CLI 时,请在 --policy-name 参数中指定要编辑的策略名称。为要更改的参数指定新的值。

  • 在使用 Application Auto Scaling API 时,请在PolicyName参数。为要更改的参数指定新的值。

有关更多信息,请参阅 应用扩展策略