

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 什么是 Amazon Data Firehose？
<a name="what-is-this-service"></a>

Amazon Data Firehose 是一项完全托管的服务，用于向亚马逊简单存储服务 (Amazon S3)、亚马逊 Redshift、亚马逊服务、亚马逊无服务器、Splunk、Apache Iceberg Tables 以及支持的第三方服务提供商拥有的任何自定义 HTTP 终端节点或 HTTP 终端节点（包括 Datadog、Dyn LogicMonitor atrace、MongoDB）等目的地提供实时[流式数据](https://www.amazonaws.cn/streaming-data/)、New Relic、Coralogix 和 Elastic。 OpenSearch OpenSearch 在使用 Amazon Data Firehose 时，您无需编写应用程序或管理资源。您可以配置数据生产者，将数据发送到 Amazon Data Firehose，后者会自动将数据传输到您指定的目的地。您还可以配置 Amazon Data Firehose 在传输之前转换数据。

有关 Amazon 大数据解决方案的更多信息，请参阅[上的 Big Data Amazon](https://www.amazonaws.cn/big-data/)。有关 Amazon 流数据解决方案的更多信息，请参阅[什么是流数据？](https://www.amazonaws.cn/streaming-data/)。

## 了解关键概念
<a name="key-concepts"></a>

开始使用 Amazon Data Firehose 时，您可以从理解以下概念中受益。

**Firehose 流**  
Amazon Data Firehose 的基础实体。您可以通过创建 Firehose 流，然后向其发送数据来使用 Amazon Data Firehose。有关更多信息，请参阅[教程：从控制台创建 Firehose 流](basic-create.md)和[向 Firehose 流发送数据](basic-write.md)。

**记录**  
数据创建器发送到 Firehose 流的相关数据。记录最大可达 1000 KB。

**数据创建器**  
创建器将记录发送到 Firehose 流。例如，发送日志数据到 Firehose 流的 Web 服务器是数据创建器。您还可以配置 Firehose 流，以自动从现有 Kinesis 数据流读取数据，并将其加载到目的地。有关更多信息，请参阅 [向 Firehose 流发送数据](basic-write.md)。

**缓冲区大小和缓冲间隔**  
Amazon Data Firehose 会将传入的流数据缓冲到一定大小或一段时间，然后再将其传送到目的地。 **Buffer Size**已进入 MBs 并以秒**Buffer Interval**为单位。

## 了解 Amazon Data Firehose 中的数据流
<a name="data-flow-diagrams"></a>

对于 Amazon S3 目标，流数据将传输到您的 S3 存储桶。如果启用了数据转换，您可以选择将源数据备份到另一个 Amazon S3 存储桶。

![\[显示适用于 Amazon S3 的 Amazon Data Firehose 数据流的关系图。\]](http://docs.amazonaws.cn/firehose/latest/dev/images/fh-flow-s3.png)


对于 Amazon Redshift 目标，流数据将传输到您的 S3 存储桶。然后，Amazon Data Firehose 会发出 Amazon Redshift **COPY** 命令，将数据从 S3 存储桶加载到 Amazon Redshift 集群。如果启用了数据转换，您可以选择将源数据备份到另一个 Amazon S3 存储桶。

![\[显示适用于 Amazon Redshift 的 Amazon Data Firehose 数据流的关系图。\]](http://docs.amazonaws.cn/firehose/latest/dev/images/fh-flow-rs.png)


对于 OpenSearch 服务目标，流数据将传输到您的 OpenSearch服务集群，并且可以选择将其同时备份到您的 S3 存储桶。

![\[显示服务的 Amazon Data Firehose 数据流的 OpenSearch 图表。\]](http://docs.amazonaws.cn/firehose/latest/dev/images/fh-flow-es.png)


对于 Splunk 目标，流数据将传输到 Splunk，并且可以选择将流数据同时备份到 S3 存储桶中。

![\[显示适用于 Splunk 的 Amazon Data Firehose 数据流的关系图。\]](http://docs.amazonaws.cn/firehose/latest/dev/images/fh-flow-splunk.png)


# 将 Firehose 与 SDK 配合使用 Amazon
<a name="sdk-general-information-section"></a>

Amazon 软件开发套件 (SDKs) 可用于许多流行的编程语言。每个软件开发工具包都提供 API、代码示例和文档，使开发人员能够更轻松地以其首选语言构建应用程序。


| SDK 文档 | 
| --- | 
| [Amazon CLI](https://docs.amazonaws.cn/cli) | 
| [适用于 Java 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-java) | 
| [适用于 JavaScript 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-javascript) | 
| [适用于 .NET 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-net) | 
| [适用于 PHP 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-php) | 
| [Amazon Tools for PowerShell](https://docs.amazonaws.cn/powershell) | 
| [适用于 Python (Boto3) 的 Amazon SDK](https://docs.amazonaws.cn/pythonsdk) | 
| [适用于 Ruby 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-ruby) | 
| [适用于 SAP ABAP 的 Amazon SDK](https://docs.amazonaws.cn/sdk-for-sapabap) | 