SVL_S3QUERY_SUMMARY - Amazon Redshift
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

SVL_S3QUERY_SUMMARY

使用 SVL_S3QUERY_SUMMARY 视图可获取已在系统上运行的所有 Amazon Redshift Spectrum 查询(S3 查询)的汇总。SVL_S3QUERY_SUMMARY 汇总段级别的 SVL_S3QUERY 的详细信息。

SVL_S3QUERY_SUMMARY 对所有用户可见。超级用户可以查看所有行;普通用户只能查看其自己的数据。有关更多信息,请参阅系统表和视图中的数据可见性

此表中的部分或全部数据也可以在 SYS 监控视图 SYS_EXTERNAL_QUERY_DETAIL 中找到。SYS 监控视图中的数据经过格式化处理,便于使用和理解。我们建议您使用 SYS 监控视图进行查询。

对于 SVCS_S3QUERY_SUMMARY,请参阅 SVCS_S3QUERY_SUMMARY

表列

列名称 数据类型 描述
userid integer 已生成给定条目的用户的 ID。
query integer 查询 ID。您可以使用此值联接各种其他系统表和视图。
xid bigint 事务 ID。
pid integer 进程 ID。
segment integer 段编号。一个查询包含多个区段,而且每个区段包含一个或多个步骤。
step integer 运行的查询步骤。
starttime timestamp 开始执行查询的时间(采用 UTC 表示)。
endtime timestamp 查询完成的时间(采用 UTC 表示)。
elapsed integer 运行查询花费的时长(单位为微秒)。
aborted integer 如果查询已由系统停止或已由用户取消,则此列包含 1。如果查询运行完成,则此列包含 0
external_table_name char(136) 外部表扫描的表的外部名称的名称内部格式。
file_format character(16) 外部表数据的文件格式。
is_partitioned char(1) 如果为 true (t),则此列值表示外部表已进行分区。
is_rrscan char(1) 如果为 true (t),则此列值表示已应用限制范围的扫描。
is_nested char(1) 如果为 true (t),该列值表示访问嵌套的列数据类型。
s3_scanned_rows bigint 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的行数量。
s3_scanned_bytes bigint 已从 Amazon S3 扫描并发送到 Redshift Spectrum 层的基于压缩数据的字节的数量。
s3query_returned_rows bigint 已从 Redshift Spectrum 层返回到集群的行的数量。
s3query_returned_bytes bigint 已从 Redshift Spectrum 层返回到集群的字节的数量。返回到 Amazon Redshift 的大量数据可能会影响系统性能。
files integer 针对此 Redshift Spectrum 查询已处理的文件的数量。文件数量少会限制并行处理的优势。
files_max integer 在一个切片上处理的最大文件数。
files_avg integer 在一个切片上处理的平均文件数。
splits int 为此分段处理的拆分数。在此切片上处理的拆分数。对于大型可拆分数据文件(例如,大于 512 MB 左右的数据文件),Redshift Spectrum 会尝试将文件拆分为多个 S3 请求以便进行并行处理。
splits_max int 在此切片上处理的最大拆分数。
splits_avg int 在此切片上处理的平均拆分数。
total_split_size bigint 处理的所有拆分的总大小。
max_split_size bigint 处理的最大拆分大小(以字节为单位)。
avg_split_size bigint 处理的平均拆分大小(以字节为单位)。
total_retries integer 单个处理文件的最大重试次数。
max_retries integer 任何已处理文件的最大重试次数。
max_request_duration integer 单个文件请求的最长持续时间(以微秒为单位)。长时间运行的查询可能表示瓶颈。
avg_request_duration double precision 文件请求的平均持续时间(以微秒为单位)。
max_request_parallelism integer 该 Redshift Spectrum 查询的一个切片中的最大并行请求数。
avg_request_parallelism double precision 该 Redshift Spectrum 查询的一个切片中的平均并行请求数。
total_slowdown_count bigint 在外部表扫描期间出现减速错误的总 Amazon S3 请求数。
max_slowdown_count integer 在一个切片上的外部表扫描期间出现减速错误的最大 Amazon S3 请求数。

示例查询

以下示例获取上次完成的查询的扫描步骤详细信息。

select query, segment, elapsed, s3_scanned_rows, s3_scanned_bytes, s3query_returned_rows, s3query_returned_bytes, files from svl_s3query_summary where query = pg_last_query_id() order by query,segment;
query | segment | elapsed | s3_scanned_rows | s3_scanned_bytes | s3query_returned_rows | s3query_returned_bytes | files
------+---------+---------+-----------------+------------------+-----------------------+------------------------+------
 4587 |       2 |   67811 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  591568 |          172462 |         11260097 |                  8513 |                 170260 |     1
 4587 |       2 |  216849 |               0 |                0 |                     0 |                      0 |     0
 4587 |       2 |  216671 |               0 |                0 |                     0 |                      0 |     0