Amazon Kinesis Data Streams
开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

读取 Amazon Kinesis Data Streams 中的数据

使用器 是一种处理 Kinesis 数据流中的所有数据的应用程序。当使用器使用增强型扇出功能 时,它会获取其自己的 2 MiB/秒的读取吞吐量配额,从而允许多个使用器同时读取相同流中的数据,而不必与其他使用器争用读取吞吐量。要使用分片的增强型扇出功能,请参阅利用使用增强型扇出功能的使用者

默认情况下,流中的每个分片均提供 2 MiB/秒的读取吞吐量。此吞吐量跨正在从某给定分片进行读取的所有使用器获取分片。换言之,每个分片的默认 2 MiB/秒的吞吐量是固定的,即使有多个使用器正在从分片中进行读取。要使用分片的此默认吞吐量,请参阅开发 Amazon Kinesis Data Streams 使用器

下表将默认吞吐量与增强型扇出功能进行比较。消息传播延迟被定义为使用有效负载调度 API(如 PutRecord 和 PutRecords)发送的有效负载通过有效负载消耗 API(如 GetRecords 和SubscribeToShard)到达使用者应用程序所花费的时间(以毫秒为单位)。

特性 没有增强型扇出功能的未注册使用者 具有增强型扇出功能的注册使用者
分片读取吞吐量 每个分片的 2MiB/秒总吞吐量是固定的。如果有多个使用器正在从同一分片进行读取,则它们将全部共享此吞吐量。它们从分片中接收的吞吐量总和不会超出 2 MiB/秒。 随着使用器注册进行扩展以使用增强型扇出功能。注册为使用增强型扇出功能的每个使用器均接收其自己的每个分片的读取吞吐量,最多 2MiB/秒,独立于其他使用器。
消息传播延迟 平均约 200 毫秒(如果您有一个从流中读取的使用者)。如果您有五个使用者,则这个平均值高达约 1000 毫秒。 通常情况下,平均为 70 毫秒,无论您是拥有一个使用者,还是五个使用者。
成本 不适用 存在数据检索费用和使用器分片小时费用。有关更多信息,请参阅Amazon Kinesis Data Streams 定价
记录传输模型 使用 GetRecords 通过 HTTP 提取模型。 Kinesis Data Streams 使用 SubscribeToShard 通过 HTTP/2 将记录推送给您。