通过描述扩展活动来检查扩展活动的状态 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

通过描述扩展活动来检查扩展活动的状态

您可以通过描述扩展活动来检查自动扩展终端节点的扩展活动状态。Application Auto Scaling 提供有关前六周指定命名空间中扩展活动的描述性信息。有关更多信息,请参阅《Auto Scaling Auto Scaling 用户指南》中的应用程序 Auto Scaling 的扩展活动

要检查扩展活动的状态,请使用describe-scaling-activities命令。您无法使用控制台检查扩展活动的状态。

描述扩展活动 (Amazon CLI)

要描述在 Application Auto Scaling 中注册的所有 SageMaker 资源的扩展活动,请使用sagemaker--service-namespace选项指定describe-scaling-activities命令。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker

要描述特定资源的扩展活动,请添加--resource-id选项。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

以下示例显示了运行此命令时生成的输出。

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "string", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "string", "StatusMessage": "string" }

从实例配额中识别被阻止的扩展活动 (Amazon CLI)

当您扩展(添加更多实例)时,您可能会达到账户级别的实例配额。您可以使用describe-scaling-activities命令来检查是否已达到您的实例配额。当您超出配额时,auto 缩放将被阻止。

要检查您是否已达到实例配额,请使用describe-scaling-activities命令并为该--resource-id选项指定资源 ID。

aws application-autoscaling describe-scaling-activities \ --service-namespace sagemaker \ --resource-id endpoint/my-endpoint/variant/my-variant

在返回语法中,检查StatusCodeStatusMessage键及其关联值。 StatusCode返回Failed。在 StatusMessage 中有一条消息,表明已达到账户级别的服务限额。消息类似于以下示例:

{ "ActivityId": "activity-id", "ServiceNamespace": "sagemaker", "ResourceId": "endpoint/my-endpoint/variant/my-variant", "ScalableDimension": "sagemaker:variant:DesiredInstanceCount", "Description": "string", "Cause": "minimum capacity was set to 110", "StartTime": timestamp, "EndTime": timestamp, "StatusCode": "Failed", "StatusMessage": "Failed to set desired instance count to 110. Reason: The account-level service limit 'ml.xx.xxxxxx for endpoint usage' is 1000 Instances, with current utilization of 997 Instances and a request delta of 20 Instances. Please contact Amazon support to request an increase for this limit. (Service: AmazonSageMaker; Status Code: 400; Error Code: ResourceLimitExceeded; Request ID: request-id)." }