优化 Amazon OpenSearch Service 数据来源的查询性能 - Amazon OpenSearch Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

优化 Amazon OpenSearch Service 数据来源的查询性能

访问外部数据来源时,Amazon OpenSearch Service 的查询性能可能会降低。这可能由于网络延迟、数据转换或大数据量等因素造成。要提高性能,考虑根据使用案例对选定数量的数据进行索引:

  • 加速 Amazon S3 上的直接查询(跳过索引)

  • 在 Security Lake 上构建控制面板可视化(实体化视图)

  • 使用索引视图提取查询结果,用于离线审查或提高 Security Lake(实体化视图)的性能

有关加速查询的完整文档(包括示例查询),请参阅开源文档中的使用 OpenSearch 索引优化查询性能

跳过索引

跳转索引仅摄取存储在 Amazon S3 中数据的元数据。查询带有跳过索引的表时,查询计划程序会利用该索引重写查询语句,从而高效定位数据位置,而无需扫描所有分区和文件。此方法有助于缩小存储数据的确切位置范围。

创建跳过索引有两种方法。第一种方法是在数据来源详细信息中自动生成跳过索引。第二种方法是使用查询工作台,通过 SQL 语句手动创建跳过索引。

要从数据来源自动生成跳过索引,请转到控制面板管理加速数据,然后选择您的数据库和表(可能需要刷新以获取最新的数据库和表)。然后,您可以选择生成以自动生成跳过索引,也可以手动选择需要索引的每个字段并指定加速(跳过索引类型)。最后,选择创建加速,以创建填充新跳过索引的重复性作业。

仅 Amazon S3 数据来源支持跳过索引。

有关使用查询工作台设置跳过索引的更多信息,请参阅 OpenSearch 文档中的跳过索引

实体化视图

实体化视图使用聚合等复杂查询为 OpenSearch 控制面板的可视化提供支持。这些视图根据查询提取数据的子集,并将其存储在 OpenSearch 索引中。然后,您可以使用此索引创建可视化效果。

Amazon S3 和 Security Lake 数据来源均支持实体化视图。

有关使用查询工作台设置实体化视图的更多信息,请参阅 OpenSearch 文档中的实体化视图

覆盖索引

覆盖索引从表中指定的列摄取数据,OpenSearch 基于这些数据创建新的索引。您可以将此新索引用于可视化以及其他 OpenSearch 功能,例如异常检测或地理空间分析。

仅 Amazon S3 数据来源支持覆盖索引。

有关设置覆盖索引的更多信息,请参阅 OpenSearch 文档中的覆盖索引