从补丁 198 开始，Amazon Redshift 将不再支持创建新的 Python UDF。现有的 Python UDF 将继续正常运行至 2026 年 6 月 30 日。有关更多信息，请参阅[博客文章](https://www.amazonaws.cn/blogs/big-data/amazon-redshift-python-user-defined-functions-will-reach-end-of-support-after-june-30-2026/)。

# SYS\_STREAM\_SCAN\_STATES
<a name="r_SYS_STREAM_SCAN_STATES"></a>

记录通过串流摄取加载的记录的扫描状态。

SYS\_STREAM\_SCAN\_STATES 对所有用户可见。超级用户可以查看所有行；普通用户只能查看其自己的数据。有关更多信息，请参阅 [系统表和视图中的数据可见性](cm_chap_system-tables.md#c_visibility-of-data)。

## 表列
<a name="r_SYS_STREAM_SCAN_STATES-table-rows"></a>


| 列名称  | 数据类型  | 说明  | 
| --- | --- | --- | 
| external\_schema\_name  | character(128)  | 外部模式名称。区分大小写。 | 
| stream\_name  | character(255)  | 流名称。区分大小写。 | 
| mv\_name | character(128)  | 关联的实体化视图的名称。如果无关联视图，则为空。区分大小写。 | 
| transaction\_id | bigint  | 事务 ID。 | 
| query\_id  | bigint  | 查询 ID。 | 
| record\_time | 不带时区的时间戳 | 记录数据的时间。 | 
| partition\_id | character(128)  | 分区或分片 ID。区分大小写。 | 
| latest\_position | character(128)  | 批次中读取的最后一条记录的位置。这对应于 Kinesis 中的序列号或 Amazon MSK 中的偏移。区分大小写。 | 
| scanned\_rows | bigint | 批次中扫描的记录数。 | 
| skipped\_rows | bigint | 批次中跳过的记录数。 | 
| scanned\_bytes | bigint | 批次中扫描的字节数。 | 
| stream\_record\_time\_min | 不带时区的时间戳 | 批次中最早记录的 Kinesis 或 Amazon MSK 抵达时间。 | 
| stream\_record\_time\_max | 不带时区的时间戳 | 批次中最晚记录的 Kinesis 或 Amazon MSK 抵达时间。 | 

以下查询显示了特定查询的串流和主题数据。

```
select query_id,mv_name::varchar,external_schema_name::varchar,stream_name::varchar,sum(scanned_rows) total_records,
sum(scanned_bytes) total_bytes from sys_stream_scan_states where query in (5401180,8601939) group by 1,2,3,4;

  query_id  |    mv_name     | external_schema_name |   stream_name   | total_records |  total_bytes
------------+----------------+----------------------+-----------------+---------------+----------------
 5401180    | kinesistest    | kinesis              | kinesisstream   |    1493255696 | 3209006490704
 8601939    | msktest        | msk                  | mskstream       |      14677023 |   31056580668
(2 rows)
```