SVCS_S3QUERY_SUMMARY

使用 SVCS_S3QUERY_SUMMARY 视图可获取已在系统上运行的所有数据湖查询的摘要。一个段可以执行一个外部表扫描。

注意

带有前缀 SVCS 的系统视图提供了有关主集群和并发扩展集群上的查询的详细信息。这些视图与带有前缀 SVL 的视图类似，但 SVL 视图仅提供在主集群上运行的查询的信息。

SVCS_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行；普通用户只能查看其自己的数据。有关更多信息，请参阅系统表和视图中的数据可见性。

有关 SVL_S3QUERY 的信息，请参阅 SVL_S3QUERY。

表列

列名称	数据类型	描述
userid	integer	已生成给定条目的用户的 ID。
query	integer	查询 ID。您可以使用此值联接各种其他系统表和视图。
xid	bigint	事务 ID。
pid	integer	进程 ID。
segment	integer	段编号。一个查询包含多个区段，而且每个区段包含一个或多个步骤。
step	integer	运行的查询步骤。
starttime	timestamp	开始运行该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。
endtime	timestamp	完成该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。
elapsed	integer	运行该段中的 Redshift Spectrum 查询所需的时间长度（以微秒为单位）。
aborted	integer	如果查询已由系统停止或已由用户取消，则此列包含 `1`。如果查询运行完成，则此列包含 `0`。
external_table_name	char(136)	外部表扫描的表的外部名称的名称内部格式。
file_format	character(16)	外部表数据的文件格式。
is_partitioned	char(1)	如果为 true (`t`)，则此列值表示外部表已进行分区。
is_rrscan	char(1)	如果为 true (`t`)，则此列值表示已应用限制范围的扫描。
is_nested	varchar(1)	如果为 true (`t`)，该列值表示访问嵌套的列数据类型。
s3_scanned_rows	bigint	已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的行数量。在 RG 预置集群上，这是在筛选条件下推之前，集群的原生读取器跨所有切片直接从 Amazon S3 扫描的总行数。
s3_scanned_bytes	bigint	已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的基于压缩数据的字节的数量。在 RG 预置集群上，这是在筛选条件下推之前，集群的原生读取器跨所有切片直接从 Amazon S3 扫描的总字节数。
s3query_returned_rows	bigint	已从 Redshift Spectrum 层返回到集群的行的数量。在 RG 预置集群上，这是在筛选条件下推之后，集群的原生读取器跨所有切片返回的总行数。
s3query_returned_bytes	bigint	已从 Redshift Spectrum 层返回到集群的字节的数量。返回到 Amazon Redshift 的大量数据可能会影响系统性能。在 RG 预置集群上，这是在筛选条件下推之后，集群的原生读取器跨所有切片返回的总字节数。
files	整数	为此数据湖查询处理的文件数。文件数量少会限制并行处理的优势。
files_max	integer	一个切片上处理的最大文件数。
files_avg	integer	一个切片上处理的平均文件数。
splits	bigint	为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件（例如，大于 512 MB 左右的数据文件），Redshift Spectrum 会尝试将文件拆分为多个 S3 请求以便进行并行处理。
splits_max	integer	在此切片上处理的最大拆分数。
splits_avg	bigint	在此切片上处理的平均拆分数。
total_split_size	bigint	处理的所有拆分的总大小。
max_split_size	bigint	处理的最大拆分大小（以字节为单位）。
avg_split_size	bigint	处理的平均拆分大小（以字节为单位）。
total_retries	bigint	该段中的 Redshift Spectrum 查询的总重试次数。在 RG 节点类型集群上，此列已弃用并包含 -1。有关 RG 上的 Amazon S3 客户端重试，请参阅 `STL_S3CLIENT`。
max_retries	integer	一个处理的文件的最大重试次数。在 RG 节点类型集群上，此列已弃用并包含 -1。有关 RG 上的 Amazon S3 客户端重试，请参阅 `STL_S3CLIENT`。
max_request_duration	bigint	单个文件请求的最长持续时间（以微秒为单位）。长时间运行的查询可能表示瓶颈。在 RG 节点类型集群上，此列已弃用并包含 -1。
avg_request_duration	bigint	文件请求的平均持续时间（以微秒为单位）。在 RG 节点类型集群上，此列已弃用并包含 -1。
max_request_parallelism	integer	该 Redshift Spectrum 查询的一个切片中的最大并行请求数。在 RG 节点类型集群上，此列已弃用并包含 -1。
avg_request_parallelism	double precision	该 Redshift Spectrum 查询的一个切片中的平均并行请求数。在 RG 节点类型集群上，此列已弃用并包含 -1。
total_slowdown_count	bigint	在外部表扫描期间出现减速错误的总 Amazon S3 请求数。在 RG 节点类型集群上，此列已弃用并包含 -1。
max_slowdown_count	integer	在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。在 RG 节点类型集群上，此列已弃用并包含 -1。

示例查询

以下示例获取上次运行的查询的扫描步骤详细信息。


select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files 
from svcs_s3query_summary 
where query = pg_last_query_id() 
order by query,segment;

query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

SVCS_S3PARTITION_SUMMARY

SVCS_STREAM_SEGS