在 OpenSearch 控制面板中查询数据 - 亚马逊 OpenSearch 服务
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 OpenSearch 控制面板中查询数据

设置表并配置所需的可选查询加速后,您现在可以开始对数据执行分析。要查询您的数据,请从 OpenSearch 控制面板“发现”页面或“可观测性”页面的下拉菜单中选择数据来源。

如果您使用跳过索引或尚未创建索引,则可以使用 SQL 或管道处理语言(PPL)来查询数据。如果您已配置实体化视图或覆盖索引,则您已有索引,并可在整个控制面板中使用控制面板查询语言(DQL)。您也可以将 PPL 与可观测性插件结合使用,将 SQL 与查询工作台插件结合使用。目前,只有可观测性和查询工作台插件支持 PPL 和 SQL。要使用 OpenSearch Service API 查询数据,请参阅 async API 文档

注意

并非所有 PPL 命令和功能都受支持。有关受支持命令的列表,请参阅支持的命令

SQL

使用以下查询对您在 使用 Query Workbench 创建 Spark 表 中创建的 VPC 流日志表运行示例 SQL 查询:

SELECT srcaddr, SUM (CAST(bytes AS LONG)) as total_bytes FROM datasourcename.gluedatabasename.vpclogstable GROUP BY srcaddrORDER BY total_bytes DESCLIMIT 10;

PPL

使用以下查询对您在 使用 Query Workbench 创建 Spark 表 中创建的 VPC 流日志表运行示例 PPL 查询:

source = datasourcename.gluedatabasename.vpclogstable | fields account_id, srcaddr, dstaddr, action | head 10

建议

在某些情况下,返回的结果可能不合预期。如果您遇到任何问题,建议您执行以下操作:

  • SELECT * 语句未返回任何结果:请检查您的表以确认是否有需要分解的嵌套 struc 列。

  • 选择多个表时,请使用 SQL UNION 语句来引用多个表。

  • 将加速设置为使用特定数量的 Worker 节点来执行查询。如果查询返回缓慢,则可以手动分配更多的 Worker 节点来执行查询,以提高性能。

  • 构建跳过索引时,使用 Bloom 筛选器来实现高基数特性,使用最小/最大值来表示大范围,从而节省域的空间。如果需要执行精确匹配,则建议在中等基数字段上设置值。

  • 有关常用 SQL 查询的更多信息,请参阅 Amazon 服务日志