快照保留优化
借助 Apache Iceberg 快照保留功能,用户可以查询特定时间点的历史数据并撤销对表的非预期修改。在 Amazon Glue Data Catalog 中,快照保留配置功能会控制这些快照(表数据的不同版本)在过期和移除之前的保留期限。该功能会根据配置的保留期或要保留的最大快照数量自动移除较早的快照,有助于管理存储成本和元数据开销。
您可以为表配置保留期(以天为单位)和要保留的最大快照数量。Amazon Glue 会从表元数据中移除早于指定保留期的快照,同时确保最新的快照数量保持在配置的限制范围内。从元数据中移除旧快照后,Amazon Glue 会删除不再引用并且是已过期快照所独有的对应数据和元数据文件。这有利于确保仅需查询剩余保留的快照,同时回收已过期快照数据占用的存储空间。