本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
注意事项和限制
生成列统计数据时应注意以下因素和限制。
注意事项
使用采样方法生成统计数据可以减少运行时间,但生成的统计数据可能不准确。
每次列统计数据运行都需要处理整个数据集。
Data Catalog 不会存储不同版本的统计数据。
每个表一次只能运行一个统计数据生成任务。
如果使用注册到 Data Catalog 的客户 Amazon KMS 密钥对表进行加密,则 Amazon Glue 将使用相同的密钥来加密统计数据。
在满足下列条件中的一个时,列统计数据任务才能生成统计数据:
该 IAM 角色拥有完整的表权限(IAM 或 Lake Formation)。
该 IAM 角色使用 Lake Formation 混合访问模式取得了对表的权限。
对于下列情况,列统计数据任务不支持生成统计数据:
表启用了基于 Lake Formation 单元格的访问控制。
事务处理数据湖 – Linux 基金会 Delta Lake、Apache Iceberg、Apache Hudi。
联合身份验证数据库中的表 – Hive 元数据存储、Amazon Redshift 数据共享
嵌套列、数组和结构数据类型。
其他账户共享给您的表。