本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
什么是 Amazon Kinesis Data Firehose?
Amazon Kinesis Data Firehose 是一项完全托管的服务,用于将实时流数据传输
有关Amazon大数据解决方案的更多信息,请参阅上的大数据Amazon
注意
请注意最新的 Amazon MSKAmazon 流数据解决方案
重要概念
当你开始使用 Kinesis Data Firehose 时,你将受益于理解以下概念:
- Kinesis Data Firehose 传输流
-
Kinesis Data Firehose 的基础实体。您可以创建 Kinesis Data Firehose 传输流然后将数据发送到 Kinesis Data Firehose 传输流。有关更多信息,请参阅 创建 Amazon Kinesis Data Firehose 传输流 和 将数据发送到 Amazon Kinesis Data Firehose 传输流。
- record
-
您的数据创建者发送到 Kinesis Data Firehose 传输流的感兴趣的数据。记录最大可达 1000 KB。
- 数据创建器
-
制作人将记录发送到 Kinesis Data Firehose 传输流。例如,发送日志数据到传输流的 Web 服务器是数据创建器。您还可以将 Kinesis Data Firehose 传输流配置为自动从现有 Kinesis 数据流读取数据,然后将其加载到目的地。有关更多信息,请参阅 将数据发送到 Amazon Kinesis Data Firehose 传输流。
- 缓冲区大小和缓冲间隔
-
Kinesis Data Firehose 会将传入的流数据缓冲到一定大小或一段时间,然后再将其传送到目的地。 Buffer Size以 MB 为单位Buffer Interval,以秒为单位。
数据流
对于 Amazon S3 目的地,流数据将传输到您的 S3 存储桶。如果启用了数据转换,则可以选择将源数据备份到另一个 Amazon S3 存储桶。

对于 Amazon Redshift 目的地,流数据会先传输到您的 S3 存储桶。然后,Kinesis Data Firehose 发出 Amazon RedshiftCOPY 命令,将数据从你的 S3 存储桶加载到你的 Amazon Redshift 集群。如果启用了数据转换,则可以选择将源数据备份到另一个 Amazon S3 存储桶。

对于 OpenSearch 服务目标,流数据将传送到您的 OpenSearch服务集群,并且可以选择将其同时备份到您的 S3 存储桶。

对于 Splunk 目标,流数据将传输到 Splunk,并且可以选择将流数据同时备份到 S3 存储桶中。
