Amazon OpenSearch Ingestion 中的关键概念 - 亚马逊 OpenSearch 服务
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon OpenSearch Ingestion 中的关键概念

开始使用 OpenSearch Ingestion 之前,了解这些关键概念会很有帮助。

管道

从In OpenSearch gestion 的角度来看,管道是指您在 Service 中创建的单个预调配的数据收集器。 OpenSearch 您可以将其视为整个 YAML 配置文件,其中包含一个或多个子管道。有关创建提取管道的步骤,请参阅创建管道

子管道

您可以在 YAML 配置文件定义子管道。每个子管道都由一个来源、一个缓冲区、零个或多个处理器以及一个或多个接收器组成。您可以在单个 YAML 文件中定义多个子管道,每个子管道都有唯一的来源、处理器和接收器。为了便于使用 CloudWatch 和其他服务进行监控,建议您指定的管道名称与其所有子管道都不同。

您可以在单个 YAML 文件中将多个子管道串在一起,这样一个子管道的源是另一个子管道,而其接收器是第三个子管道。有关示例,请参阅将采集管道与 C OpenSearch ollector 配合使用 OpenTelemetry

来源

子管道的输入组件。它定义了管道使用记录的机制。源可以处理事件,其方法是通过 HTTPS 接收事件,或从 Amazon S3 等外部端点读取事件。源有两种类型:基于推送的源基于拉取的源。基于推送的来源(例如 HTTPOTel 日志)将记录流式传输到摄取端点。基于拉取的源(例如 OTel traceS3)从源中提取数据。

处理器

中间处理单元,可以在将记录发布到接收器之前对其进行筛选、转换和扩充为所需格式。处理器是管道的可选组件。如果您未定义处理器,则记录将以源文件中定义的格式发布。可以有多个处理器。管道按照定义处理器的顺序来运行处理器。

sink

子管道的输出组件。它定义了子管道向其发布记录的一个或多个目的地。 OpenSearch Ingestion 支持将 OpenSearch 服务域作为接收器。它还支持子管道作为接收器。这意味着您可以将单个 OpenSearch Ingestion 管道(YAML 文件)中的多个子管道串在一起。不支持将自行管理的 OpenSearch 集群作为接收器。

Buffer

处理器的一部分,在源和接收器之间充当缓冲层。您无法在管道中手动配置缓冲区。 OpenSearch Ingestion 使用默认的缓冲区配置。

路线

处理器的一部分,可让管道作者仅向不同接收器发送符合特定条件的事件。

有效的子管道定义必须包含源和接收器。有关每个管道元素的更多信息,请参阅配置参考