

# 优化 Iceberg 表
<a name="table-optimizers"></a>

Amazon Glue 支持多种表优化选项，以增强 Amazon 分析引擎和 ETL 作业使用的 Apache Iceberg 表的管理和性能。这些优化器可提高存储空间利用效率、提升查询性能，并实现有效的数据管理。Amazon Glue 中提供了三种表优化器：
+ **压缩** – 数据压缩功能可压缩小数据文件，以减少存储空间使用量并提升读取性能。此功能会合并和重写数据文件以移除过时数据，并将碎片数据合并到更大、更高效的文件中。您可以将压缩配置为自动运行。

  Binpack 是 Apache Iceberg 中的默认压缩策略。该策略会将较小的数据文件合并为较大的数据文件，从而实现最佳性能。压缩还支持将相似数据聚类在一起的排序和 Z 形排序策略。排序策略根据指定列整理数据，从而提高筛选出的操作的查询性能。Z 形排序会形成排序后的数据集，可在同时查询多列时提高查询性能。所有这三种压缩策略（bincpak、排序和 Z 形排序）都可减少查询引擎要扫描的数据量，从而降低查询处理成本。
+ **快照保留** – 快照是带有时间戳的 Iceberg 表版本。借助快照保留配置，客户可以强制规定快照保留期限和要保留的快照数量。配置快照保留优化器可以移除不必要的旧快照及其相关底层文件，从而帮助管理存储开销。
+ **孤立文件删除** – 孤立文件是指不再被 Iceberg 表元数据引用的文件。这些文件可能会逐渐堆积，尤其是在表删除或 ETL 任务失败等操作之后。启用孤立文件删除功能后，Amazon Glue 会定期识别并移除这些不必要的文件，从而释放存储空间。

可通过 Lake Formation 控制台，使用 Amazon Glue `UpdateCatalog` API 操作实现目录级优化配置。您可以使用 Amazon Glue 控制台、Amazon CLI 或 Amazon Glue API 操作，在数据目录中为单个 Iceberg 表启用或禁用压缩、快照保留和孤立文件删除优化器。

 以下视频说明了如何在数 Data Catalog 中为 Iceberg 表配置优化器。

**Topics**
+ [表优化的先决条件](optimization-prerequisites.md)
+ [目录级表优化器](catalog-level-optimizers.md)
+ [优化压缩](compaction-management.md)
+ [快照保留优化](snapshot-retention-management.md)
+ [删除孤立文件](orphan-file-deletion.md)
+ [查看优化详细信息](view-optimization-status.md)
+ [查看 Amazon CloudWatch 指标](view-optimization-metrics.md)
+ [删除优化器](delete-optimizer.md)
+ [注意事项和限制](optimizer-notes.md)
+ [表优化器支持的区域](regions-optimizers.md)