目标设置 - 亚马逊 Data Firehose
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

亚马逊 Data Firehose 以前被称为亚马逊 Kinesis Data Firehose

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

目标设置

本主题介绍了传输流的目标位置设置。有关缓冲提示的更多信息,请参阅缓冲提示

选择 Amazon S3 作为您的目标

要使用 Amazon S3 作为 FirehoseDelivery 直播的目的地,您必须指定以下设置:

  • 输入以下字段的值:

    S3 bucket

    请选择一个您拥有的用于接收流数据的 S3 存储桶。您可以创建一个新 S3 存储桶或选择现有的 S3 存储桶。

    新行分隔符

    您可以将传输流配置为在传送到 Amazon S3 的对象中的记录之间添加新的行分隔符。为此,请选择启用。若不在传输到 Amazon S3 的对象中的记录之间添加新行分隔符,请选择禁用。如果您计划使用 Athena 查询包含聚合记录的 S3 对象,请启用此选项。

    S3 存储桶前缀(可选)

    如果您未启用动态分区,该字段为可选字段。如果您选择启用动态分区,则必须指定 S3 错误存储桶前缀,以便 Firehose 在错误情况下将数据传输到 Amazon S3 时使用。如果 Firehose 无法对您的传入数据进行动态分区,则这些数据记录将传送到此 S3 错误存储桶前缀。有关更多信息,请参阅 Amazon S3 对象名称格式Amazon S3 对象的自定义前缀

    动态分区

    选择启用以启用和配置动态分区。

    多记录解聚

    多记录解聚是解析传输流中的记录,并根据有效的 JSON 或指定的换行符分隔记录的过程。

    如果您将多个事件、日志或记录聚合到单个 PutRecord 和 PutRecordBatch API 调用中,则仍然可以启用和配置动态分区。对于聚合数据,当您启用动态分区时,Firehose 会分离记录并在每个 API 调用中查找多个有效的 JSON 对象。将传输流配置为使用 Kinesis Data Stream 作为源时,您还可以使用 Kinesis Producer Library(KPL)中的内置聚合。数据分区功能在数据解聚后执行。因此,每次 API 调用中的每条记录都可以传输到不同的 Amazon S3 前缀。您还可以利用 Lambda 函数集成,在数据分区功能之前执行任何其他解聚或转换。

    重要

    如果数据是聚合的,则只有在执行数据解聚后才能应用动态分区。因此,如果您对聚合数据启用动态分区,则必须选择启用才能启用多记录解聚。

    FirehoseDelivery 流按以下顺序执行以下处理步骤:KPL(protobuf)解聚合、JSON 或分隔符解聚合、Lambda 处理、数据分区、数据格式转换和 Amazon S3 交付。

    多记录解聚类型

    如果您启用了多记录解聚功能,则必须指定 Firehose 解聚数据的方法。使用下拉菜单选择 JSON分隔

    内联解析

    内联解析是一种受支持的机制,可以对发往 Amazon S3 的数据进行动态分区。要使用内联解析对数据进行动态分区,则必须指定要用作分区键的数据记录参数,并为每个指定的分区键提供一个值。选择启用以启用和配置内联解析。

    重要

    如果您在上述步骤中指定了 Amazon Lambda 函数来转换源记录,则可以使用此函数对绑定到 S3 的数据进行动态分区,并且仍然可以通过内联解析创建分区密钥。通过动态分区,您可以使用内联解析或 Amazon Lambda 函数来创建分区键。或者,您可以同时使用内联解析和 Amazon Lambda 函数来创建分区键。

    动态分区键

    您可以使用字段指定用作动态分区键的数据记录参数,并使用 jq 查询生成动态分区键值。Firehose仅支持 jq 1.6。您最多可以指定 50 个动态分区键。您必须为动态分区键值输入有效的 jq 表达式,才能成功为传输流配置动态分区。

    S3 存储桶前缀

    启用和配置动态分区时,必须指定 Firehoseis 要向其传送分区数据的 S3 存储桶前缀。

    为了正确配置动态分区,S3 存储桶前缀的数量必须与指定分区键的数量相同。

    您可以使用内联解析或指定的 Amazon Lambda 函数对源数据进行分区。如果您指定了 Amazon Lambda 函数来为源数据创建分区密钥,则必须使用以下格式手动键入 S3 存储桶前缀值:“Lambda: keyID” partitionKeyFrom。如果您使用内联解析为源数据指定分区密钥,则可以使用以下格式手动键入 S3 存储桶预览值:“partitionKeyFromquery: keyID”,也可以选择应用动态分区密钥按钮使用动态分区键/值对自动生成 S3 存储桶前缀。在使用内联解析或 Lambda Amazon 对数据进行分区时,您还可以在您的 S3 存储桶前缀中使用以下表达式形式:! {namespace: value},其中命名空间可以是 Query partitionKeyFrom 或 Lambda。 partitionKeyFrom

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩和加密

    选择 GZIP、Snappy、Zip 或 Hadoop 兼容的 Snappy 数据压缩,或者不压缩数据。Snappy、Zip 和 Hadoop 兼容的 Snappy 压缩,不适用于以 Amazon Redshift 作为目标位置的传输流。

    Firehose 支持使用 Amazon Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的Amazon KMS密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认Amazon托管Amazon KMS密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用具有 Amazon KMS 托管密钥的服务器端加密(SSE-KMS)保护数据

选择 Amazon Redshift 作为您的目标

本节介绍了使用 Amazon Redshift 作为传输流目标的设置。

根据您是否拥有 Amazon Redshift 预置集群或 Amazon Redshift Serverless 工作组,选择以下任一过程。

Amazon Redshift 预置集群

本节介绍了使用 Amazon Redshift 预置集群作为传输流目标的设置。

  • 输入以下字段的值:

    集群

    Amazon Redshift 集群,S3 存储桶数据将复制到该集群。将 Amazon Redshift 集群配置为可公开访问并解除封锁 Firehose IP 地址。有关更多信息,请参阅 授予亚马逊 Data Firehose 访问亚马逊 Redshift 目的地的权限

    用户名

    有权访问 Amazon Redshift 集群的 Amazon Redshift 用户。该用户必须具有 Amazon Redshift INSERT 权限才能将数据从 S3 存储桶复制到 Amazon Redshift 集群。

    密码

    有权访问集群的用户的密码。

    数据库

    Amazon Redshift 数据库,数据将复制到该数据库。

    Amazon Redshift 表,数据将复制到该表。

    (可选)表的特定列,数据将复制到该特定列。如果 Amazon S3 对象中定义的列数少于 Amazon Redshift 表中的列数,请使用此选项。

    中间 S3 目标

    Firehose 会先将您的数据传输到您的 S3 存储桶,然后发出 Amazon Redshift 命令将数据加载到您的亚马逊 COPY Redshift 集群中。请指定一个您拥有的用于接收流数据的 S3 存储桶。创建新的 S3 存储桶或选择您当前拥有的存储桶。

    将数据加载到您的亚马逊 Redshift 集群后,Firehose 不会将其从您的 S3 存储桶中删除。您可以使用生命周期配置管理 S3 存储桶中的数据。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的对象生命周期管理

    中间 S3 存储桶前缀

    (可选)要对 Amazon S3 对象使用默认前缀,请将此选项留空。Firehose 会自动对已交付的 Amazon S3 对象使用 YYYY/MM/dd/HH “” UTC 时间格式的前缀。您可以将此前缀添加到开头。有关更多信息,请参阅 Amazon S3 对象名称格式

    COPY options

    您可以在 Amazon Redshift COPY 命令中指定的参数。您可以根据自己的配置情况酌情使用这些参数。例如,如果启用了 Amazon S3 数据压缩,则需要“GZIP”。如果您的 S3 存储桶与 Amazon Redshift 集群不在同一 Amazon 区域,则需要“REGION”。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    COPY command

    Amazon Redshift COPY 命令。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    Retry duration

    如果您的 COPY Amazon Redshift 集群的数据出现故障,Firehose 重试的持续时间(0—7200 秒)。Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果您将重试持续时间设置为 0(零)秒,Firehose 不会在命令失败时COPY重试。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩和加密

    选择 GZIP 或不压缩数据。

    Firehose 支持使用 Amazon Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的Amazon KMS密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认Amazon托管Amazon KMS密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用具有 Amazon KMS 托管密钥的服务器端加密(SSE-KMS)保护数据

Amazon Redshift Serverless 工作组

本节介绍了使用 Amazon Redshift Serverless 作为传输流目标的设置。

  • 输入以下字段的值:

    Workgroup name (工作组名称)

    Amazon Redshift Serverless 工作组,S3 存储桶数据将复制到该工作组。将 Amazon Redshift Serverless 工作组配置为可公开访问并解除封锁 FireHoseIP 地址。有关更多信息,请参阅连接到 Amazon Redshift Serverless 中的“连接到可公开访问的 Amazon Redshift Serverless 实例”部分,以及“授予亚马逊 Data Firehose 访问亚马逊 Redshift 目的地的权限 ”。

    用户名

    有权访问 Amazon Redshift Serverless 工作组的 Amazon Redshift 用户。该用户必须具有 Amazon Redshift INSERT 权限才能将数据从 S3 存储桶复制到 Amazon Redshift Serverless 工作组。

    密码

    有权访问 Amazon Redshift Serverless 工作组权限的用户的密码。

    数据库

    Amazon Redshift 数据库,数据将复制到该数据库。

    Amazon Redshift 表,数据将复制到该表。

    (可选)表的特定列,数据将复制到该特定列。如果 Amazon S3 对象中定义的列数少于 Amazon Redshift 表中的列数,请使用此选项。

    中间 S3 目标

    Firehose 首先将您的数据传输到您的 S3 存储桶,然后发出 Amazon COPY Redshift 命令将数据加载到您的亚马逊 Redshift 无服务器工作组。请指定一个您拥有的用于接收流数据的 S3 存储桶。创建新的 S3 存储桶或选择您当前拥有的存储桶。

    将数据加载到您的 Amazon Redshift 无服务器工作组后,Firehose 不会将其从您的 S3 存储桶中删除。您可以使用生命周期配置管理 S3 存储桶中的数据。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的对象生命周期管理

    中间 S3 存储桶前缀

    (可选)要对 Amazon S3 对象使用默认前缀,请将此选项留空。Firehose 会自动对已交付的 Amazon S3 对象使用 YYYY/MM/dd/HH “” UTC 时间格式的前缀。您可以将此前缀添加到开头。有关更多信息,请参阅 Amazon S3 对象名称格式

    COPY options

    您可以在 Amazon Redshift COPY 命令中指定的参数。您可以根据自己的配置情况酌情使用这些参数。例如,如果启用了 Amazon S3 数据压缩,则需要“GZIP”。如果您的 S3 存储桶与 Amazon Redshift Serverless 工作组不在同一 Amazon 区域,则需要“REGION”。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    COPY command

    Amazon Redshift COPY 命令。有关更多信息,请参阅《Amazon Redshift 数据库开发人员指南》中的 COPY

    Retry duration

    如果您的 COPY Amazon Redshift Serverless 工作组的数据出现故障,Firehose 重试的持续时间(0—7200 秒)。Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果您将重试持续时间设置为 0(零)秒,Firehose 不会在命令失败时COPY重试。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

    S3 压缩和加密

    选择 GZIP 或不压缩数据。

    Firehose 支持使用 Amazon Key Management Service (SSE-KMS) 的 Amazon S3 服务器端加密,用于加密亚马逊 S3 中交付的数据。您可以选择使用目标 S3 存储桶中指定的默认加密类型,也可以选择使用您拥有的Amazon KMS密钥列表中的密钥进行加密。如果您使用密钥加密数据,则可以使用默认Amazon托管Amazon KMS密钥 (aws/s3) 或客户托管密钥。有关更多信息,请参阅使用具有 Amazon KMS 托管密钥的服务器端加密(SSE-KMS)保护数据

为您的目的地选择 OpenSearch 服务

本节介绍在目的地使用 OpenSearch 服务的选项。

  • 输入以下字段的值:

    OpenSearch 服务域

    您的数据传输到的 OpenSearch 服务域。

    索引

    将数据索引到 OpenSearch 服务集群时使用的 OpenSearch 服务索引名称。

    Index rotation

    选择是否轮换 OpenSearch 服务索引以及轮换频率。如果启用了索引轮换,Firehose 会将相应的时间戳附加到指定的索引名称并进行轮换。有关更多信息,请参阅 OpenSearch 服务目标的索引轮换

    类型

    将数据索引到 OpenSearch 服务集群时使用的 OpenSearch 服务类型名称。对于 Elasticsearch 7. OpenSearch x 和 1.x,每个索引只能有一个类型。如果您尝试为已有其他类型的现有索引指定新类型,Firehose 将在运行时返回错误。

    对于 Elasticsearch 7.x,请将此字段留空。

    Retry duration

    如果对您的服务集群的索引请求失败,Firehose 重试的持续时间(0—7200 秒)。 OpenSearch Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果您将重试持续时间设置为 0(零)秒,Firehose 不会在索引请求失败时重试。

    DocumentID 类型

    指示设置文档 ID 的方法。支持的方法有 Firehose 生成的文档 ID 和 OpenSearch 服务生成的文档 ID。未设置文档 ID 值时,Firehose 生成的文档 ID 是默认选项。 OpenSearch 推荐使用服务生成的文档 ID,因为它支持写入密集型操作,包括日志分析和可观察性,在 OpenSearch 服务域中消耗更少的 CPU 资源,从而提高性能。

    目标 VPC 连接

    如果您的 OpenSearch 服务域位于私有 VPC 中,请使用此部分指定该 VPC。还要指定您希望 Firehose 在向您的服务域发送数据时使用的子网和子组。 OpenSearch您可以使用与 OpenSearch 服务域相同的安全组。如果您指定不同的安全组,请确保它们允许 OpenSearch 服务域安全组的出站 HTTPS 流量。此外,请确保 OpenSearch 服务域的安全组允许来自您在配置传输流时指定的安全组的 HTTPS 流量。如果您对传输流和 OpenSearch 服务域使用相同的安全组,请确保安全组的入站规则允许 HTTPS 流量。有关安全组规则的更多信息,请参阅 Amazon VPC 文档中的安全组规则

    重要

    在私有 VPC 中指定向目标传输数据的子网时,请确保所选子网中有足够数量的免费 IP 地址。如果指定子网中没有可用的免费 IP 地址,Firehose 将无法为私有 VPC 中的数据传输创建或添加 ENI,并且传输将降级或失败。

    缓冲区提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

为您的 OpenSearch 目的地选择无服务器

本节介绍在目的地使用 OpenSearch 无服务器的选项。

  • 输入以下字段的值:

    OpenSearch 无服务器集合

    您的数据传输到的一组 OpenSearch 无服务器索引的终端节点。

    索引

    将数据索引到 OpenSearch 无服务器集合时使用的 OpenSearch 无服务器索引名称。

    目标 VPC 连接

    如果您的 OpenSearch 无服务器集合位于私有 VPC 中,请使用此部分指定该 VPC。还要指定您希望 Firehose 在向您的无服务器集合发送数据时使用的子网和子组。 OpenSearch

    重要

    在私有 VPC 中指定向目标传输数据的子网时,请确保所选子网中有足够数量的免费 IP 地址。如果指定子网中没有可用的免费 IP 地址,Firehose 将无法为私有 VPC 中的数据传输创建或添加 ENI,并且传输将降级或失败。

    Retry duration

    如果对您的无服务器集合的索引请求失败,Firehose 重试的持续时间(0—7200 秒)。 OpenSearch Firehose 每 5 分钟重试一次,直到重试持续时间结束。如果您将重试持续时间设置为 0(零)秒,Firehose 不会在索引请求失败时重试。

    缓冲区提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 HTTP 端点作为您的目标

本节介绍了使用 HTTP 端点作为目标的选项。

重要

如果您选择 HTTP 端点作为目标,请查看并按照 附录 - HTTP 端点传输请求和响应规范 中的说明进行操作。

  • 提供下列字段的值:

    HTTP 端点名称(可选)

    为 HTTP 端点指定一个用户友好的名称。例如,My HTTP Endpoint Destination

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://xyz.httpendpoint.com。URL 必须是 HTTPS URL。

    访问密钥(可选)

    联系端点所有者获取访问密钥(如果需要),以便能够从 Firehose 向其端点传输数据。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

    重要

    对于 HTTP 终端节点目标,如果您在 CloudWatch 日志中看到来自目标端点的 413 个响应代码,请降低传输流上的缓冲提示大小并重试。

选择 Datadog 作为您的目标

本节介绍了使用 Datadog 作为目标的选项。有关 Datadog 的更多信息,请参阅 https://docs.datadoghq.com/integrations/amazon_web_services/

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉菜单的以下选项中选择 HTTP 端点 URL:

    • Datadog 日志 - US1

    • Datadog 日志 - US5

    • Datadog 日志 - EU

    • Datadog 日志 - GOV

    • Datadog 指标 - US

    • Datadog 指标 - EU

    API 密钥

    联系 Datadog 获取允许从 Firehose 向该端点传输数据所需的 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 Honeycomb 作为您的目标

本节介绍了使用 Honeycomb 作为目标的选项。有关 Honeycomb 的更多信息,请参阅 https://docs.honeycomb.io/ getting-data-in /metrics//aws-cloudwatch-metrics

  • 提供下列字段的值:

    Honeycomb Kinesis 端点

    按以下格式指定 HTTP 端点的 URL:https://api.honeycomb.io/1/kinesis_events/{{dataset}}

    API 密钥

    联系 Honeycomb 获取允许从 Firehose 向该端点传输数据所需的 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP 以启用请求的内容编码。这是 Honeycomb 目标的推荐选项。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 Coralogix 作为您的目标

本节介绍了使用 Coralogix 作为目标的选项。有关 Coralogix 的更多信息,请参阅 https://coralogix.com/integrations/aws-firehose

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉菜单的以下选项中选择 HTTP 端点 URL:

    • Coralogix - US

    • Coralogix - SINGAPORE

    • Coralogix - IRELAND

    • Coralogix - INDIA

    • Coralogix - STOCKHOLM

    私有密钥

    联系 Coralogix 获取允许从 Firehose 向该端点传输数据所需的私钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP 以启用请求的内容编码。这是 Coralogix 目标的推荐选项。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    • applicationName:运行 Data Firehose 的环境

    • subsystemName:Data Firehose 集成的名称

    • computerName:正在使用的传输流的名称

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 Dynatrace 作为您的目标

本节介绍了使用 Dynatrace 作为目标的选项。欲了解更多信息,请参阅 https://www.dynatrace.com/support/help/technology-support/cloud-platforms/ amazon-web-services /integrations//cloudwatch-metric-streams

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉菜单中选择 HTTP 端点 URL(Dynatrace USDynatrace EUDynatrace Global)。

    API 令牌

    生成从 Firehose 传输数据所需的 Dynatrace API 令牌。欲了解更多信息,请参阅 https://www.dynatrace.com/support/help/dynatrace-api/basics/dynatrace-api-authentication/

    API URL

    提供 Dynatrace 环境的 API URL。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择您的 LogicMonitor 目的地

本部分介绍将 LogicMonitor 用于您的目标的选项。欲了解更多信息,请参阅 https://www.logicmonitor.com

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://ACCOUNT.logicmonitor.com。

    API 密钥

    请联系 LogicMonitor 以获取允许从 Firehose 向该端点传输数据所需的 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 Logz.io 作为您的目标

本节介绍了使用 Logz.io 作为目标的选项。欲了解更多信息,请参阅 https://logz.io/

注意

在欧洲(米兰)地区,不支持 Logz.io 作为亚马逊数据 FirehoseDestination。

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://listener-aws-metrics-stream-<region>.logz.io/。例如,https://listener-aws-metrics-stream-us.logz.io/。URL 必须是 HTTPS URL。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向 Logz.io 发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 MongoDB Cloud 作为您的目标

本节介绍了使用 MongoDB Cloud 作为目标的选项。欲了解更多信息,请参阅 https://www.mongodb.com

  • 提供下列字段的值:

    MongoDB Realm webhook URL

    按以下格式指定 HTTP 端点的 URL:https://webhooks.mongodb-realm.com。URL 必须是 HTTPS URL。

    API 密钥

    联系 MongoDB Cloud 获取启用从 Firehose 向该端点传输数据所需的 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 在多长时间内重试向选定的第三方提供商发送数据。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

选择 New Relic 作为您的目标

本节介绍了使用 New Relic 作为目标的选项。欲了解更多信息,请参阅 https://newrelic.com

  • 提供下列字段的值:

    HTTP 端点 URL

    从下拉菜单的以下选项中选择 HTTP 端点 URL:

    • New Relic 日志 - US

    • New Relic 指标 - US

    • New Relic 指标 - EU

    API 密钥

    在 New Relic One Account 设置中输入许可证密钥(40 个字符的十六进制字符串)。要启用从 Firehose 向该端点传输数据,需要此 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向 New Relic HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择雪花作为您的目的地

本节介绍将 Snowflake 用于目的地的选项。

连接设置
  • 提供下列字段的值:

    雪花账号网址

    指定 Snowflake 提供的区域账户网址。有关如何确定账户网址的信息,请参阅 Snowflake 文档。例如:xy12345.us-east-1.aws.snowflakecomputing.com。请注意,不得指定端口号,而协议 (https://) 是可选的。

    用户登录

    指定用于加载数据的 Snowflake 用户。确保用户有权将数据插入到 Snowflake 表中。

    私有密钥

    指定用于通过 Snowflake 进行身份验证的密钥对的用户私钥。确保私钥采用 PKCS8 格式。请勿将 PEM 页眉和页脚作为私钥的一部分。如果密钥被分成多行,请删除换行符。

    Passphrase (密码)

    密码用于在私钥加密时解密私钥。如果私钥未加密,则将此字段留空。有关信息,请参阅使用密钥对身份验证和密钥轮换

    角色配置

    使用默认 Snowflake 角色 — 如果选择此选项,Firehose 将不会将任何角色传递给 Snowflake。假设默认角色是加载数据。请确保默认角色有权将数据插入到 Snowflake 表中。

    使用自定义 Snowflake 角色 — 输入将数据加载到 Snowflake 表时由 Firehose 担任的非默认雪花角色。

    Snowflake 连接

    选项有 “有” 或 “公开”。

    私有 VPCE ID(可选)

    Firehose 与 Snowflake 私下连接的 VPCE ID。身份证格式为 com.amazonaws.vpce。 [区域] .vpce-svc-[id]。有关更多信息,请参阅 Amazon PrivateLink & Snow flake

数据库配置
  • 要使用 Snowflake 作为 FirehoseDelivery 直播的目的地,你必须指定以下设置:

    • Snowflake 数据库 — Snowflake 中的所有数据都保存在数据库中。

    • Snowflake 架构 — 每个数据库由一个或多个架构组成,这些架构是数据库对象(例如表和视图)的逻辑分组

    • Snowflake 表 — Snowflake 中的所有数据都存储在数据库表中,在逻辑上结构为列和行的集合。

您的 Snowflake 表的数据加载选项

  • 使用 JSON 键作为列名

  • 使用变体列

    • 内容列名-在表中指定列名,原始数据必须加载到该表中。

    • 元数据列名(可选)-在表中指定列名,其中必须加载元数据信息。

选择 Splunk 作为目标

本部分介绍使用 Splunk 作为目标的选项。

注意

Firehose 向配置了 Classic 负载均衡器或应用程序负载均衡器的 Splunk 集群提供数据。

  • 提供下列字段的值:

    Splunk cluster endpoint

    要确定终端节点,请参阅 Splunk 文档中的配置 Amazon Kinesis Firehose 以将数据发送到 Splunk 平台

    Splunk endpoint type

    在大多数情况下,请选择 Raw endpoint。如果已使用 Amazon Lambda 预处理您的数据,以便按事件类型将数据发送到不同的索引,请选择 Event endpoint。有关要使用的终端节点的信息,请参阅 Splunk 文档中的配置 Amazon Kinesis Firehose 以将数据发送到 Splunk 平台

    身份验证令牌

    要设置可以从 Firehose 接收数据的 Splunk 终端节点,请参阅 Splunk 文档中适用于亚马逊 Kinesis Firehose 的 Splunk 插件的安装和配置概述。保存在为该传输流设置终端节点时从 Splunk 获取的令牌,并在此处添加该令牌。

    HEC acknowledgement timeout

    指定 Firehose 等待来自 Splunk 的索引确认需要多长时间。如果 Splunk 在达到超时时间之前没有发送确认,Firehose 会将其视为数据传输失败。然后,Firehose 要么重试数据,要么将数据备份到您的 Amazon S3 存储桶,具体取决于您设置的重试持续时间值。

    Retry duration

    指定 Firehose 重试向 Splunk 发送数据的时间长度。

    发送数据后,Firehose 首先等待 Splunk 的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 Splunk 发送数据(无论是初次尝试还是重试)时,它都会重新启动确认超时计数器并等待 Splunk 的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

选择 Splunk Observability Cloud 作为您的目标

本节介绍了使用 Splunk Observability Cloud 作为目标的选项。欲了解更多信息,请参阅 https://docs.splunk.com/observability/en/gdi/ get-data-in /connect/aws/aws-apiconfig.html # connect-to-aws-using the-splunk-observability-cloud-api

  • 提供下列字段的值:

    云摄取端点 URL

    您可以在 Splunk Observability 控制台的“配置文件”>“组织”>“实时数据摄取端点”中,找到 Splunk Observability Cloud 的实时数据摄取 URL。

    访问令牌

    从 Splunk Observability 控制台的“设置”>“访问令牌”中,复制具有 INGEST 授权范围的 Splunk Observability 访问令牌

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向选定的 HTTP 端点发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。目标位置的建议缓冲区大小因服务提供商而异。

选择 Sumo Logic 作为您的目标

本节介绍了使用 Sumo Logic 作为目标的选项。欲了解更多信息,请参阅 https://www.sumologic.com

  • 提供下列字段的值:

    HTTP 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://deployment name.sumologic.net/receiver/v1/kinesis/dataType/access token。URL 必须是 HTTPS URL。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向 Sumo Logic 发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。Elastic 目标的建议缓冲区大小因服务提供商而异。

选择 Elastic 作为您的目标

本节介绍了使用 Elastic 作为目标的选项。

  • 提供下列字段的值:

    Elastic 端点 URL

    按以下格式指定 HTTP 端点的 URL:https://<cluster-id>.es.<region>.aws.elastic-cloud.com。URL 必须是 HTTPS URL。

    API 密钥

    联系 Elastic 服务部门获取允许从 Firehose 向其服务传输数据所需的 API 密钥。

    内容编码

    在将请求发送到目标之前,Firehose使用内容编码来压缩请求的正文。选择 GZIP(默认选择)或禁用,以启用/禁用请求的内容编码。

    Retry duration

    指定 Firehose 重试向 Elastic 发送数据的时间长度。

    发送数据后,Firehose 首先等待来自 HTTP 端点的确认。如果发生错误或确认未在确认超时时间内到达,Firehose 会启动重试持续时间计数器。它将不断重试,直到重试持续时间到期。之后,Firehose 认为这是数据传输失败,并将数据备份到您的 Amazon S3 存储桶中。

    每当 Firehose 向 HTTP 端点发送数据时(无论是初次尝试还是重试),它都会重新启动确认超时计数器并等待 HTTP 端点的确认。

    即使重试时长到期,Firehose 仍会等待确认,直到收到确认或达到确认超时时间。如果确认超时,Firehose 将确定重试计数器中是否还有剩余时间。如果有剩余时间,它将再次重试并重复该逻辑,直到收到确认或确定重试时间已到期。

    如果您不希望 Firehose 重试发送数据,请将此值设置为 0。

    参数(可选)

    Firehose 在每个 HTTP 调用中都包含这些键值对。这些参数可以帮助您识别和组织目标。

    缓冲提示

    Firehosebuffer 会先缓冲传入的数据,然后再将其传送到指定目的地。Elastic 目标的建议缓冲区大小为 1MiB。