Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

选择最佳排序键

Amazon Redshift 根据排序键将您的数据按照排序顺序存储在磁盘中。Amazon Redshift 查询优化程序在确定最佳查询计划时会使用排序顺序。

  • 如果最近使用的数据查询频率最高,则指定时间戳列作为排序键的第一列。

    这样查询会更高效,因为可以跳过该时间范围之外的整个数据块。

  • 如果您经常对某列进行范围筛选或相等性筛选,则指定该列作为排序键。

    Amazon Redshift 可以不读取该列全部数据块,因为它跟踪每个数据块中存储的最小和最大列值,并且可以跳过不适用于指定范围的数据块。

  • 如果您频繁联接表,则指定联接列作为排序键和分配键。

    这样,查询优化程序可以选择排序合并联接而不是较慢的哈希联接。因为数据已按联接键排序,所以查询优化程序不用执行排序合并联接的排序阶段。

有关选择和指定排序键的更多信息,请参阅教程:优化表设计选择排序键