Amazon Redshift
数据库开发人员指南 (API Version 2012-12-01)
AWS 服务或AWS文档中描述的功能,可能因地区/位置而异。点 击 Getting Started with Amazon AWS to see specific differences applicable to the China (Beijing) Region.

EXPLAIN

显示查询语句的执行计划,而不运行查询。

语法

Copy
EXPLAIN [ VERBOSE ] query

参数

VERBOSE

显示完整的查询计划,而不只是摘要。

query

要解释的查询语句。查询可以是 SELECT、INSERT、CREATE TABLE AS、UPDATE 或 DELETE 语句。

使用说明

在创建临时表时需要花费一定的时间,因此 EXPLAIN 性能有时会受到影响。例如,使用公共子表达式优化的查询需要创建和分析临时表,以返回 EXPLAIN 输出。查询计划依赖于临时表的 schema 和统计数据。因此,此类查询的 EXPLAIN 命令的运行时间可能会超过预期。

您只能对以下命令使用 EXPLAIN:

  • SELECT

  • SELECT INTO

  • CREATE TABLE AS

  • INSERT

  • UPDATE

  • DELETE

如果您对其他 SQL 命令(例如数据定义语言 (DDL) 或数据库操作)使用 EXPLAIN 命令,则该命令将失败。

查询计划和执行步骤

特定 Amazon Redshift 查询语句的执行计划会将查询的执行和计算细分为一系列单独的步骤和表操作,它们最后将为该查询生成一个最终结果集。下表提供了步骤的汇总,Amazon Redshift 可以针对用户提交供执行的任何查询,使用这些步骤来制定执行计划。

EXPLAIN 运算符 查询执行步骤 描述
SCAN:
顺序扫描 scan Amazon Redshift 关系扫描或表扫描运算符或步骤。从头开始按顺序扫描整个表直至结尾;另外,如果在 WHERE 子句中指定它,则还会评估每一行的查询约束(筛选条件)。它还用于运行 INSERT、UPDATE 和 DELETE 语句。
JOINS:Amazon Redshift 根据要联接的表的物理设计、联接所需的数据位置以及查询本身的特定属性,来使用不同的联接运算符。子查询扫描 - 使用子查询扫描和附加来运行 UNION 查询。
嵌套循环 nloop 优化程度最差的联接;主要用于交叉联接(笛卡尔积;没有联接条件)和一些不等式联接。
哈希联接 hjoin 还用于内部联接以及左和右外部联接,速度通常比嵌套循环联接要快。哈希联接读取外部表,对联接列进行哈希处理,然后在内部哈希表查找匹配项。步骤会溢到磁盘。(hjoin 的内部输入是可基于磁盘的哈希步骤。)
合并联接 mjoin 还用于内部联接和外部联接(用于在联接列上进行分配和排序的联接表)。在不考虑其他成本的情况下,通常这是最快的 Amazon Redshift 联接算法。
AGGREGATION:用于涉及聚合函数以及 GROUP BY 操作的查询的运算符和步骤。
聚合 aggr 标量聚合函数的运算符/步骤。
HashAggregate aggr 分组聚合函数的运算符/步骤。可利用哈希表溢到磁盘的优势来从磁盘运行。
GroupAggregate aggr 有时,force_hash_grouping 设置的 Amazon Redshift 配置设置为 off,此时为分组聚合查询选择该运算符。
SORT:在查询必须对结果集进行排序或合并时使用的运算符和步骤。
排序 sort 排序操作执行 ORDER BY 子句指定的排序,此外还执行其他一些操作,例如 UNION 和联接。可从磁盘运行。
合并 merge 根据从并行执行的操作得到的临时排序结果,来生成某个查询的最终排序结果。
EXCEPT、INTERSECT 和 UNION 操作:
SetOp Except [Distinct] hjoin 用于 EXCEPT 查询。可利用输入哈希可基于磁盘的优势来从磁盘运行。
Hash Intersect [Distinct] hjoin 用于 INTERSECT 查询。可利用输入哈希可基于磁盘的优势来从磁盘运行。
Append [All |Distinct] save 附加操作与子查询扫描结合使用,来实施 UNION 和 UNION ALL 查询。可利用“save”操作的优势来从磁盘运行。
杂项/其他:
哈希 hash 用于内部联接以及左和右外部联接(为哈希联接提供输入)。Hash 运算符为联接运算的内部表创建哈希表。(内部表是用来检查匹配项的表;在联接两个表时,通常是其中较小的那个表。)
限制 limit 评估 LIMIT 子句。
具体化 保存 具体化嵌套循环联接和某些合并联接的输入中的行。可从磁盘运行。
-- parse 用于在加载期间解析文字输入数据。
-- project 用于重新整理列和计算表达式,即项目数据。
结果 -- 运行不涉及任何表访问的标量函数。
-- return 将行返回到领导节点或客户端。
子计划 -- 用于特定的子查询。
唯一 unique 消除 SELECT DISTINCT 和 UNION 查询中的重复项。
窗口 window 计算汇总并对窗口函数进行排名。可从磁盘运行。
网络操作:
网络(广播) bcast 广播也是 Join Explain 运算符和步骤的一个属性。
网络(分布) dist 将行分布到计算节点,以便由数据仓库集群执行并行处理。
网络(发送到领导节点) return 将结果发送回领导节点,以待进一步处理。
DML 操作(用于修改数据的运算符):
插入(使用结果) insert 插入数据。
删除(扫描 + 筛选) delete 删除数据。可从磁盘运行。
更新(扫描 + 筛选) delete、insert 以删除和插入的方式实施。

示例

注意

对于这些示例,输出样本可能有所不同,具体取决于 Amazon Redshift 配置。

以下示例为从 EVENT 和 VENUE 表中选择 EVENTID、EVENTNAME、VENUEID 和 VENUENAME 的查询返回查询计划:

Copy
explain select eventid, eventname, event.venueid, venuename from event, venue where event.venueid = venue.venueid;
Copy
QUERY PLAN -------------------------------------------------------------------------- XN Hash Join DS_DIST_OUTER (cost=2.52..58653620.93 rows=8712 width=43) Hash Cond: ("outer".venueid = "inner".venueid) -> XN Seq Scan on event (cost=0.00..87.98 rows=8798 width=23) -> XN Hash (cost=2.02..2.02 rows=202 width=22) -> XN Seq Scan on venue (cost=0.00..2.02 rows=202 width=22) (5 rows)

以下示例使用详细输出为同一查询返回查询计划:

Copy
explain verbose select eventid, eventname, event.venueid, venuename from event, venue where event.venueid = venue.venueid;
Copy
QUERY PLAN -------------------------------------------------------------------------- {HASHJOIN :startup_cost 2.52 :total_cost 58653620.93 :plan_rows 8712 :plan_width 43 :best_pathkeys <> :dist_info DS_DIST_OUTER :dist_info.dist_keys ( TARGETENTRY { VAR :varno 2 :varattno 1 ... XN Hash Join DS_DIST_OUTER (cost=2.52..58653620.93 rows=8712 width=43) Hash Cond: ("outer".venueid = "inner".venueid) -> XN Seq Scan on event (cost=0.00..87.98 rows=8798 width=23) -> XN Hash (cost=2.02..2.02 rows=202 width=22) -> XN Seq Scan on venue (cost=0.00..2.02 rows=202 width=22) (519 rows)

以下示例返回 CREATE TABLE AS (CTAS) 语句的查询计划:

Copy
explain create table venue_nonulls as select * from venue where venueseats is not null; QUERY PLAN ----------------------------------------------------------- XN Seq Scan on venue (cost=0.00..2.02 rows=187 width=45) Filter: (venueseats IS NOT NULL) (2 rows)