收集和利用表格统计信息 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

收集和利用表格统计信息

收集表统计信息使天合基于成本的优化器能够就联接顺序、筛选器下推和分区修剪做出明智的决策,从而提高性能。

您可以使用ANALYZE命令收集 Hive 或 Iceberg 表的统计信息:

ANALYZE sales;

在宽表上收集统计数据可能会对资源造成负担。我们建议指定用于联接、筛选器或分组操作的列的子集。

这是另一个有用的命令。它显示表格的当前统计信息,以验证统计数据是否为最新。

show stats for table_name;