注意事项和限制
生成列统计数据时应注意以下因素和限制。
注意事项
使用采样方法生成统计数据可以减少运行时间,但生成的统计数据可能不准确。
Data Catalog 不会存储不同版本的统计数据。
每个表一次只能运行一个统计数据生成任务。
如果使用注册到 Data Catalog 的客户 Amazon KMS 密钥对表进行加密,则 Amazon Glue 将使用相同的密钥来加密统计数据。
在满足下列条件中的一个时,列统计数据任务才能生成统计数据:
该 IAM 角色拥有完整的表权限(IAM 或 Lake Formation)。
该 IAM 角色使用 Lake Formation 混合访问模式取得了对表的权限。
对于下列情况,列统计数据任务不支持生成统计数据:
启用了 Lake Formation 基于单元格的访问控制的表
事务处理数据湖 – Linux 基金会 Delta Lake、Apache Hudi
联合身份验证数据库中的表 – Hive 元数据存储、Amazon Redshift 数据共享
嵌套列、数组和结构数据类型。
其他账户共享给您的表