Amazon Redshift
数据库开发人员指南 (API 版本 2012-12-01)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

选择最佳排序键

Amazon Redshift 根据排序键将您的数据按照排序顺序存储在磁盘中。Amazon Redshift 查询优化程序在确定最佳查询计划时会使用排序顺序。

  • 如果最近使用的数据查询频率最高,则指定时间戳列作为排序键的第一列。

    这样查询会更高效,因为可以跳过该时间范围之外的整个数据块。

  • 如果您经常对某列进行范围筛选或相等性筛选,则指定该列作为排序键。

    Amazon Redshift 可以不读取该列全部数据块,因为它跟踪每个数据块中存储的最小和最大列值,并且可以跳过不适用于指定范围的数据块。

  • 如果您频繁联接表,则指定联接列作为排序键和分配键。

    这样,查询优化程序可以选择排序合并联接而不是较慢的哈希联接。因为数据已按联接键排序,所以查询优化程序不用执行排序合并联接的排序阶段。

有关选择和指定排序键的更多信息,请参阅教程:优化表设计选择排序键