SVCS_S3QUERY_SUMMARY - Amazon Redshift
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

SVCS_S3QUERY_SUMMARY

可以使用 SVCS_S3QUERY_SUMMARY 视图获取已在系统上运行的所有 Redshift Spectrum 查询(S3 查询)的摘要。一个段可以执行一个外部表扫描。

注意

带有前缀 SVCS 的系统视图提供了有关主集群和并发扩展集群上的查询的详细信息。这些视图与带有前缀 SVL 的视图类似,但 SVL 视图仅提供在主集群上运行的查询的信息。

SVCS_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行;普通用户只能查看其自己的数据。有关更多信息,请参阅系统表和视图中的数据可见性

有关 SVL_S3QUERY 的信息,请参阅 SVL_S3QUERY

表列

列名称 数据类型 描述
userid integer 已生成给定条目的用户的 ID。
query integer 查询 ID。您可以使用此值联接各种其他系统表和视图。
xid bigint 事务 ID。
pid integer 进程 ID。
segment integer 段编号。一个查询包含多个区段,而且每个区段包含一个或多个步骤。
step integer 运行的查询步骤。
starttime timestamp 开始运行该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。
endtime timestamp 完成该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。
elapsed integer 运行该段中的 Redshift Spectrum 查询所需的时间长度(以微秒为单位)。
aborted integer 如果查询已由系统停止或已由用户取消,则此列包含 1。如果查询运行完成,则此列包含 0
external_table_name char(136) 外部表扫描的表的外部名称的名称内部格式。
file_format character(16) 外部表数据的文件格式。
is_partitioned char(1) 如果为 true (t),则此列值表示外部表已进行分区。
is_rrscan char(1) 如果为 true (t),则此列值表示已应用限制范围的扫描。
is_nested varchar(1) 如果为 true (t),该列值表示访问嵌套的列数据类型。
s3_scanned_rows bigint 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的行数量。
s3_scanned_bytes bigint 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的基于压缩数据的字节的数量。
s3query_returned_rows bigint 已从 Redshift Spectrum 层返回到集群的行的数量。
s3query_returned_bytes bigint 已从 Redshift Spectrum 层返回到集群的字节的数量。返回到 Amazon Redshift 的大量数据可能会影响系统性能。
files integer 针对此 Redshift Spectrum 查询已处理的文件的数量。文件数量少会限制并行处理的优势。
files_max integer 一个切片上处理的最大文件数。
files_avg integer 一个切片上处理的平均文件数。
splits bigint 为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件(例如,大于 512 MB 左右的数据文件),Redshift Spectrum 会尝试将文件拆分为多个 S3 请求以便进行并行处理。
splits_max integer 在此切片上处理的最大拆分数。
splits_avg bigint 在此切片上处理的平均拆分数。
total_split_size bigint 处理的所有拆分的总大小。
max_split_size bigint 处理的最大拆分大小(以字节为单位)。
avg_split_size bigint 处理的平均拆分大小(以字节为单位)。
total_retries bigint 该段中的 Redshift Spectrum 查询的总重试次数。
max_retries integer 一个处理的文件的最大重试次数。
max_request_duration bigint 单个文件请求的最长持续时间(以微秒为单位)。长时间运行的查询可能表示瓶颈。
avg_request_duration bigint 文件请求的平均持续时间(以微秒为单位)。
max_request_parallelism integer 该 Redshift Spectrum 查询的一个切片中的最大并行请求数。
avg_request_parallelism double precision 该 Redshift Spectrum 查询的一个切片中的平均并行请求数。
total_slowdown_count bigint 在外部表扫描期间出现减速错误的总 Amazon S3 请求数。
max_slowdown_count integer 在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。

示例查询

以下示例获取上次运行的查询的扫描步骤详细信息。

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------               
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0