吞吐量模式 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

吞吐量模式

Ama SageMaker zon Feature Store 提供两种定价模式可供选择:按需 (On-demand) 和预配置 (Provisioned) 吞吐量模式。 On-demand最适合可预测性较低的流量,而最Provisioned适合一致且可预测的流量。

您可以选择在给定功能组的Provisioned吞吐量模式On-demand和吞吐量模式之间切换,以适应应用程序流量模式发生变化或不可预测的时期。在 24 小时内,您只能将功能组吞吐量模式更新为一On-demand次。吞吐量模式可以通过编程方式使用UpdateFeature群组 API 或通过控制台 UI 进行更新。有关如何使用控制台的更多信息,请参阅在控制台中使用 A SageMaker mazon Feature Store

您可以将Provisioned吞吐量模式用于仅限离线访问的功能组或具有Standard存储类型的功能组。对于其他存储配置,则使用On-demand吞吐量模式。有关在线和离线存储配置的信息,请分别参见在线存储离线存储

有关定价的更多详情,请参阅 Amazon SageMaker 定价

按需吞吐量模式

当您使用具有未知工作负载、不可预测的应用程序流量且无法预测容量需求的功能组时,On-demand(默认)吞吐量模式效果最佳。

On-demand模式向您收取应用程序对功能组执行的读取和写入的费用。您无需指定您期望应用程序执行多少读取和写入吞吐量,因为 Feature Store 可在工作负载增加或减少时立即适应您的工作负载。您只需为实际用量付费,用ReadRequestsUnits和来衡量WriteRequestsUnits

您可以使用CreateFeature群组或群UpdateFeature组 API 或通过控制台 UI 启用On-demand吞吐量模式。有关使用控制台 UI 的更多信息,请参阅在控制台中使用 A SageMaker mazon Feature Store

重要

在 24 小时内,您只能将功能组吞吐量模式更新为一On-demand次。

预配置吞吐量模式

当您使用具有可预测工作负载的功能组时,Provisioned吞吐量模式效果最好,并且您可以预测容量需求以控制成本。对于某些可以提前预测吞吐量需求的工作负载,这可以提高其成本效益。

将功能组设置为Provisioned模式时,需要指定容量单位,即应用程序可以从功能组中消耗的最大容量。如果您的应用程序超过此Provisioned吞吐容量,则会受到请求限制。

以下内容包括有关读取和写入容量单位的信息。

  • 使用 GetRecord API 检索最大 4 KB 的单条记录将消耗至少 1 个 RCU(读取容量单位)。检索更大的有效载荷可能需要更多时间。所需的读取容量单位总数取决于项目大小,包括Feature Store服务添加的每条记录少量元数据。

  • 使用 PutRecord API 的有效负载为 1 KB 的单个写入请求将消耗至少 1 WCU(写入容量单位),小数有效负载向上舍入到最接近的 KB。它可能会消耗更多精力,具体取决于事件时间、记录的删除状态和上线时间 (TTL) 状态。有关 TTL 的更多信息,请参阅记录的生存时间 (TTL) 持续时间

重要

设置容量单位时,请考虑以下几点:

  • 即使您未充分利用功能组的读取和写入Provisioned容量,也需要为其支付费用。

  • 如果您将读取或写入容量设置得太低,您的请求可能会受到限制。

  • 在某些情况下,由于 Feature Store 服务为启用各种功能而添加的记录级别元数据,记录可能会消耗额外的容量单位。

  • 使用GetRecordBatchGetRecord API 仅检索部分要素仍会消耗与整条记录相对应的 RCU。

  • 对于写入容量,您应预置近期峰值容量的 2 倍,以避免在执行回填或批量摄取时出现限制,因为这可能会导致大量历史记录写入。这是因为写入历史记录会消耗额外的写入容量。

  • Feature Store 目前不支持Provisioned模式的自动缩放。

您可以使用CreateFeature群组或群UpdateFeature组 API 或通过控制台 UI 启用On-demand吞吐量模式。有关使用控制台 UI 的更多信息,请参阅在控制台中使用 A SageMaker mazon Feature Store

下面介绍在启用Provisioned模式时如何增加或减少功能组的 RCU 和 WCU 吞吐量。

增加预配置吞吐量

你可以根据需要使用UpdateFeature群组 API 或控制台用户界面增加 RCU 或 WCU。

减少预配置吞吐量

您可以使用群组 API 或控制台用户界面减少功能组的 RCU 和 WCU(或两者兼而有之)。UpdateFeature

您每天可以对功能组执行的Provisioned容量减少次数有默认配额。天依据协调世界时 (UTC) 定义。在某一天,您可以在一小时内执行最多四次减少,只要您在当天未执行任何其他减少。随后,只要前一小时没有减少,您就可以每小时再减少一次。这实际上将每日的减小操作的最大次数设置为 27 次(在前 1 个小时内为 4 次减小操作,对于一天内的每个后续 1 小时时段,为 1 次减小操作)。

吞吐量模式指标

处于On-demand模式的功能组将发出ConsumedReadRequestsUnitsConsumedWriteRequestsUnits指标。处于Provisioned模式的功能组将发出ConsumedReadCapacityUnitsConsumedWriteCapacityUnits指标。有关功能商店指标的更多信息,请参阅Amazon SageMaker 特色商店指标

吞吐量模式限制

每个 Amazon Web Services 账户 都有默认的服务配额或限制,用于帮助确保可用性并管理账单风险。有关默认配额和限制的信息,请参阅配额、命名规则和数据类型

在某些情况下,这些限制可能低于文档中所述的限制。如果您需要更高的限额,可以提交提高限额的请求。最好在达到当前限制之前这样做,以免工作中断。有关服务配额以及如何请求增加配额的更多信息,请参阅 Amazon 服务配额