收集和利用表统计数据 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

收集和利用表统计数据

收集表统计数据使 Trino 的基于成本的优化器能够就联接顺序、筛选条件下推和分区修剪做出明智的决策,从而提高性能。

您可以使用 ANALYZE 命令收集 Hive 或 Iceberg 表的统计数据:

ANALYZE sales;

在宽表上收集统计数据可能会占用大量资源。我们建议指定用于联接、筛选或分组操作的列子集。

这是另一个有用的命令。它显示表的当前统计数据,以验证统计数据是否为最新。

show stats for table_name;