使用 PostgreSQL 管理临时文件
在 PostgreSQL 中,一个复杂的查询可能会同时执行几个排序或哈希操作,每个操作都使用实例内存来存储结果,直至达到在 work_mem
FreeStorageSpace
指标,以确保数据库实例具有足够的可用存储空间。有关更多信息,请参阅 FreeStorageSpace
对于涉及多个并发查询的工作负载(这会增加临时文件的使用量),我们建议使用 Amazon RDS 优化型读取功能。这些实例使用基于本地非易失性存储规范(NVMe)的固态硬盘(SSD)块级存储来存放临时文件。有关更多信息,请参阅 Amazon RDS 优化型读取功能。
您可以使用下面的参数和函数来管理实例中的临时文件。
-
temp_file_limit
– 此参数取消任何超过 temp_files 大小(以 KB 为单位)的查询。此限制可防止任何查询无休止地运行并使用临时文件消耗磁盘空间。您可以使用来自 log_temp_files
参数的结果来估计该值。作为最佳实践,请检查工作负载行为并根据估计值设置限制。以下示例显示了当查询超过限制时如何取消查询。postgres=>
select * from pgbench_accounts, pg_class, big_table;
ERROR: temporary file size exceeds temp_file_limit (64kB)
-
log_temp_files
– 当删除会话的临时文件时,此参数会向 postgresql.log 发送消息。此参数在查询成功完成后生成日志。因此,它可能无助于对长时间运行的活跃查询进行故障排除。 以下示例显示,当查询成功完成后,条目将记录在 postgresql.log 文件中,同时清理临时文件。
2023-02-06 23:48:35 UTC:205.251.233.182(12456):adminuser@postgres:[31236]:LOG: temporary file: path "base/pgsql_tmp/pgsql_tmp31236.5", size 140353536 2023-02-06 23:48:35 UTC:205.251.233.182(12456):adminuser@postgres:[31236]:STATEMENT: select a.aid from pgbench_accounts a, pgbench_accounts b where a.bid=b.bid order by a.bid limit 10; 2023-02-06 23:48:35 UTC:205.251.233.182(12456):adminuser@postgres:[31236]:LOG: temporary file: path "base/pgsql_tmp/pgsql_tmp31236.4", size 180428800 2023-02-06 23:48:35 UTC:205.251.233.182(12456):adminuser@postgres:[31236]:STATEMENT: select a.aid from pgbench_accounts a, pgbench_accounts b where a.bid=b.bid order by a.bid limit 10;
-
pg_ls_tmpdir
– 此函数在 RDS for PostgreSQL 13 及更高版本中提供,可让用户了解当前临时文件使用情况。完成的查询不会出现在该函数的结果中。在以下示例中,您可以查看此函数的结果。 postgres=>
select * from pg_ls_tmpdir();
name | size | modification -----------------+------------+------------------------ pgsql_tmp8355.1 | 1072250880 | 2023-02-06 22:54:56+00 pgsql_tmp8351.0 | 1072250880 | 2023-02-06 22:54:43+00 pgsql_tmp8327.0 | 1072250880 | 2023-02-06 22:54:56+00 pgsql_tmp8351.1 | 703168512 | 2023-02-06 22:54:56+00 pgsql_tmp8355.0 | 1072250880 | 2023-02-06 22:54:00+00 pgsql_tmp8328.1 | 835031040 | 2023-02-06 22:54:56+00 pgsql_tmp8328.0 | 1072250880 | 2023-02-06 22:54:40+00 (7 rows)
postgres=>
select query from pg_stat_activity where pid = 8355;
query ---------------------------------------------------------------------------------------- select a.aid from pgbench_accounts a, pgbench_accounts b where a.bid=b.bid order by a.bid (1 row)
文件名包括生成了临时文件的会话的处理 ID(PID)。更高级的查询(如以下示例所示)对每个 PID 的临时文件执行总和。
postgres=>
select replace(left(name, strpos(name, '.')-1),'pgsql_tmp','') as pid, count(*), sum(size) from pg_ls_tmpdir() group by pid;
pid | count | sum ------+------------------- 8355 | 2 | 2144501760 8351 | 2 | 2090770432 8327 | 1 | 1072250880 8328 | 2 | 2144501760 (4 rows)
-
pg_stat_statements
– 如果您激活 pg_stat_sat_statements 参数,则可以查看每个调用的平均临时文件使用量。您可以识别查询的 query_id 并使用它来检查临时文件使用情况,如以下示例所示。postgres=>
select queryid from pg_stat_statements where query like 'select a.aid from pgbench%';
queryid ---------------------- -7170349228837045701 (1 row)
postgres=>
select queryid, substr(query,1,25), calls, temp_blks_read/calls temp_blks_read_per_call, temp_blks_written/calls temp_blks_written_per_call from pg_stat_statements where queryid = -7170349228837045701;
queryid | substr | calls | temp_blks_read_per_call | temp_blks_written_per_call ----------------------+---------------------------+-------+-------------------------+---------------------------- -7170349228837045701 | select a.aid from pgbench | 50 | 239226 | 388678 (1 row)
-
Performance Insights
– 在性能详情控制面板中,可以通过开启指标 temp_bytes 和 temp_files 来查看临时文件使用情况。然后,您可以看到这两个指标的平均值,并查看它们与查询工作负载的对应关系。性能详情中的视图并未专门显示正在生成临时文件的查询。但是,当您将性能详情与针对pg_ls_tmpdir
显示的查询相结合时,您可以排查、分析并确定查询工作负载的变化。有关如何使用性能详情分析指标和查询的更多信息,请参阅使用 Performance Insights 控制面板分析指标。
有关使用性能详情查看临时文件使用情况的示例,请参阅使用性能详情查看临时文件使用情况