本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在 OpenSearch 控制面板中查询数据
设置表并配置所需的可选查询加速后,您现在可以开始对数据执行分析。要查询您的数据,请从 OpenSearch 控制面板“发现”页面或“可观测性”页面的下拉菜单中选择数据来源。
如果您使用跳过索引或尚未创建索引,则可以使用 SQL 或管道处理语言(PPL)来查询数据。如果您已配置实体化视图或覆盖索引,则您已有索引,并可在整个控制面板中使用控制面板查询语言(DQL)。您也可以将 PPL 与可观测性插件结合使用,将 SQL 与查询工作台插件结合使用。目前,只有可观测性和查询工作台插件支持 PPL 和 SQL。要使用 OpenSearch Service API 查询数据,请参阅 async API 文档
注意
并非所有 PPL 命令和功能都受支持。有关受支持命令的列表,请参阅支持的命令
SQL
使用以下查询对您在 使用 Query Workbench 创建 Spark 表 中创建的 VPC 流日志表运行示例 SQL 查询:
SELECT srcaddr, SUM (CAST(bytes AS LONG)) as total_bytes FROM
datasourcename.gluedatabasename.vpclogstable
GROUP BY srcaddrORDER BY total_bytes DESCLIMIT 10;
PPL
使用以下查询对您在 使用 Query Workbench 创建 Spark 表 中创建的 VPC 流日志表运行示例 PPL 查询:
source =
datasourcename.gluedatabasename.vpclogstable
| fields account_id, srcaddr, dstaddr, action | head 10
建议
在某些情况下,返回的结果可能不合预期。如果您遇到任何问题,建议您执行以下操作:
-
SELECT
* 语句未返回任何结果:请检查您的表以确认是否有需要分解的嵌套 struc 列。 -
选择多个表时,请使用
SQL UNION
语句来引用多个表。 -
将加速设置为使用特定数量的 Worker 节点来执行查询。如果查询返回缓慢,则可以手动分配更多的 Worker 节点来执行查询,以提高性能。
-
构建跳过索引时,使用 Bloom 筛选器来实现高基数特性,使用最小/最大值来表示大范围,从而节省域的空间。如果需要执行精确匹配,则建议在中等基数字段上设置值。
-
有关常用 SQL 查询的更多信息,请参阅 Amazon 服务日志。