本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
SVCS_S3QUERY_SUMMARY
可以使用 SVCS_S3QUERY_SUMMARY 视图获取已在系统上运行的所有 Redshift Spectrum 查询(S3 查询)的摘要。一个段可以执行一个外部表扫描。
带有前缀 SVCS 的系统视图提供了有关主集群和并发扩展集群上的查询的详细信息。这些视图与带有前缀 SVL 的视图类似,但 SVL 视图仅提供在主集群上运行的查询的信息。
SVCS_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行;普通用户只能看到自己的数据。有关更多信息,请参阅 Visibility of data in system tables and views。
有关 SVL_S3QUERY 的信息,请参阅 SVL_S3QUERY。
Table columns
列名称 | 数据类型 | Description |
---|---|---|
userid | integer | 已生成给定条目的用户的 ID。 |
query | integer | 查询 ID。您可以使用此值联接各种其他系统表和视图。 |
xid | bigint | 事务 ID。 |
pid | integer | 进程 ID。 |
segment | integer | 段编号。一个查询包含多个区段,而且每个区段包含一个或多个步骤。 |
step | integer | 已执行的查询步骤。 |
starttime | timestamp | 开始运行该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。 |
endtime | timestamp | 完成该段中的 Redshift Spectrum 查询的 UTC 时间。一个段可以具有一个外部表扫描。 |
elapsed | integer | 运行该段中的 Redshift Spectrum 查询所需的时间长度(以微秒为单位)。 |
aborted | integer | 如果系统中止查询或由用户取消,此列包含 1 。如果查询运行到完成,此列包含 0 .
|
external_table_name | char(136) | 外部表扫描的表的外部名称的名称内部格式。 |
file_format | character(16) | 外部表数据的文件格式。 |
is_partitioned | char(1) | 如果为 true (t ),则此列值表示外部表已进行分区。
|
is_rrscan | char(1) | 如果为 true (t ),则此列值表示已应用限制范围的扫描。
|
is_nested | varchar(1) | 如果为 true (t ),该列值表示访问嵌套的列数据类型。
|
s3_scanned_rows | bigint | 从 Amazon S3 中扫描并发送到 Redshift Spectrum 层的行数。 |
s3_scanned_bytes | bigint | 从 Amazon S3 中扫描并发送到 Redshift Spectrum 层的字节数(基于压缩的数据)。 |
s3query_returned_rows | bigint | 从 Redshift Spectrum 层返回到集群的行数。 |
s3query_returned_bytes | bigint | 从 Redshift Spectrum 层返回到集群的字节数。返回到 Amazon Redshift 的大量数据可能会影响系统性能。 |
files | integer | 为该 Redshift Spectrum 查询处理的文件数。文件数量少会限制并行处理的优势。 |
files_max | integer | 一个切片上处理的最大文件数。 |
files_avg | integer | 一个切片上处理的平均文件数。 |
splits | bigint | 为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件(例如,大于约 512 MB 的数据文件),Redshift Spectrum 尝试将文件拆分为多个 S3 请求以进行并行处理。 |
splits_max | integer | 在此切片上处理的最大拆分数。 |
splits_avg | bigint | 在此切片上处理的平均拆分数。 |
total_split_size | bigint | 处理的所有拆分的总大小。 |
max_split_size | bigint | 处理的最大拆分大小 (以字节为单位)。 |
avg_split_size | bigint | 处理的平均拆分大小 (以字节为单位)。 |
total_retries | bigint | 该段中的 Redshift Spectrum 查询的总重试次数。 |
max_retries | integer | 一个处理的文件的最大重试次数。 |
max_request_duration | bigint | 单个文件请求的最长持续时间 (以微秒为单位)。长时间运行的查询可能表示瓶颈。 |
avg_request_duration | bigint | 文件请求的平均持续时间 (以微秒为单位)。 |
max_request_parallelism | integer | 该 Redshift Spectrum 查询的一个切片中的最大并行请求数。 |
avg_request_parallelism | double precision | 该 Redshift Spectrum 查询的一个切片中的平均并行请求数。 |
total_slowdown_count | bigint | 在外部表扫描期间出现减速错误的总 Amazon S3 请求数。 |
max_slowdown_count | integer | 在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。 |
Sample query
以下示例获取上次运行的查询的扫描步骤详细信息。
select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svcs_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files ------+---------+---------+-----------------+------------------+-----------------------+------------------------+------ 4587 | 2 | 67811 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 591568 | 172462 | 11260097 | 8513 | 170260 | 1 4587 | 2 | 216849 | 0 | 0 | 0 | 0 | 0 4587 | 2 | 216671 | 0 | 0 | 0 | 0 | 0