注意事项和限制 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

注意事项和限制

生成列统计数据时应注意以下因素和限制。

注意事项
  • 使用采样方法生成统计数据可以减少运行时间,但生成的统计数据可能不准确。

  • 每次列统计数据运行都需要处理整个数据集。

  • Data Catalog 不会存储不同版本的统计数据。

  • 每个表一次只能运行一个统计数据生成任务。

  • 如果使用注册到 Data Catalog 的客户 Amazon KMS 密钥对表进行加密,则 Amazon Glue 将使用相同的密钥来加密统计数据。

在满足下列条件中的一个时,列统计数据任务才能生成统计数据:
  • 该 IAM 角色拥有完整的表权限(IAM 或 Lake Formation)。

  • 该 IAM 角色使用 Lake Formation 混合访问模式取得了对表的权限。

对于下列情况,列统计数据任务不支持生成统计数据:
  • 表启用了基于 Lake Formation 单元格的访问控制。

  • 事务处理数据湖 – Linux 基金会 Delta Lake、Apache Iceberg、Apache Hudi。

  • 联合身份验证数据库中的表 – Hive 元数据存储、Amazon Redshift 数据共享

  • 嵌套列、数组和结构数据类型。

  • 其他账户共享给您的表。