使用亚马逊 OpenSearch 服务使用 Amazon S3 直接查询(预览版) - 亚马逊 OpenSearch 服务
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用亚马逊 OpenSearch 服务使用 Amazon S3 直接查询(预览版)

这是针对亚马逊 OpenSearch 服务直接查询 Amazon S3 的预发行文档,该文档处于预览版。文档和特征都可能会更改。我们建议您仅在测试环境中使用此特征,不要在生产环境中使用。有关预览条款和条件,请参阅 Amazon 服务条款中的测试版和预览

您可以使用亚马逊 OpenSearch 服务直接查询来查询 Amazon S3 中的数据。Amazon Ser OpenSearch vice 提供与 Amazon S3 的直接查询集成,从而无需在服务之间切换即可分析 Amazon S3 中的操作日志和基于 Amazon S3 的数据湖中的操作日志。现在,您可以分析云对象存储中的数据,同时使用 Service 的运营分析和可视化。 OpenSearch

通过使用 Amazon S3 进行直接查询,您不再需要构建复杂的 ETL 管道,也不再需要支付在 OpenSearch 服务和 Amazon S3 存储中复制数据的费用。您还可以安装包含预定义控制面板的常用日志类型模板集成,并配置针对该日志类型量身定制的数据加速。这些模板包括 VPC 流日志Amazon CloudTrail 日志和 Amazon S3 日志。加速包括跳过索引、实体化视图和覆盖索引。

定价

您需要为用于创建和处理直接查询的现有 OpenSearch 服务和 Amazon S3 资源付费。发送到 Amazon S3 的查询使用计费计算并显示为每小时 OpenSearch 计算单位 (OCU)。

通过 Amazon S3 进行的直接查询有两种类型:交互式查询和索引维护查询。交互式查询对 Amazon S3 中的数据进行分析。当您运行新查询时,Ser OpenSearch vice 会启动一个持续至少十分钟的新会话。 OpenSearch 服务使会话保持活动状态,以确保后续查询快速运行。索引维护查询使用计算来维护 OpenSearch 服务中的索引。这些查询通常需要更长的时间,因为它们会将可配置的数据量提取到 S OpenSearch ervice 中,从而加快交互式查询的运行速度。

有关更多信息,请参阅 Amazon OpenSearch 服务定价

限制

以下限制适用于使用 Amazon S3 进行 OpenSearch 服务直接查询。

  • 您的 OpenSearch 域名必须是 2.11 或更高版本才能支持 OpenSearch 服务直接查询。

  • OpenSearch 使用 Amazon S3 进行服务直接查询仅支持中的 Spark 表 Amazon Glue Data Catalog。Hive 表不支持保持索引最新所需的 Spark 流式传输。

  • 某些数据类型不支持。支持的数据类型仅限于 Parquet、CSV 和 JSON。

  • Amazon CloudFormation 直接查询的预览版不支持模板。

  • 您的 OpenSearch 域名和 Amazon Glue Data Catalog 必须相同 Amazon Web Services 账户。您的 Amazon S3 表可以位于不同的账户中,但必须与您的域位于同一 Amazon Web Services 区域 中。

  • 不支持嵌套 Spark 结构。如果源数据使用嵌套结构,则必须将其分解为行。

  • 不支持通过 Athena 创建的表。

  • 缺少的列可能需要使用 COALESCE SQL 函数返回结果。

  • 在无 OpenSearch 服务器中不可用

  • 在查询之前必须对数据进行扁平化,或者必须使用 SQL in Serv OpenSearch ice 将嵌套列更改为专用列。

配额

您的账户具有以下与 Amazon S3 OpenSearch 服务直接查询相关的配额。每次启动查询时,Ser OpenSearch vice 都会打开一个会话并使其保持活动状态至少十分钟。这可通过消除后续查询中的会话启动时间来减少查询延迟。

描述 最大值
每个域的连接数 20
每个域的数据来源数 20
每个域的索引数 50
每个数据来源的并行会话数 100

支持的区域

以下区域可用于通过 Amazon S3 直接进行 OpenSearch 服务查询:亚太地区(东京)、欧洲(法兰克福)、欧洲(爱尔兰)、美国东部(弗吉尼亚北部)、美国东部(俄亥俄州)和美国西部(俄勒冈)。