受管理表的注意事项和限制 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

受管理表的注意事项和限制

请记住受管表的以下注释和限制:

  • 目前仅限Amazon Athena,Amazon Redshift Spectrum 和Amazon GlueETL 脚本支持查询受管理的表。Athena 查询限于只读。

  • 有关从 Amazon Redshift Spectrum 查询 Lake Formation 表的信息,请参阅。将 Redshift Spectrum 结合使用Amazon Lake Formation中的Amazon Redshift 开发人员指南。

  • 受管理的表像往常一样适用于静态加密的数据Amazon Glue管理加密密钥。与受管理表所在的 Amazon S3 位置关联的 IAM 角色需要具有Amazon KMS权限。

  • 在启用数据目录元数据加密的情况下,受管理的表照常 与受管理表所在的 Amazon S3 位置关联的 IAM 角色需要具有Amazon KMS权限。此外,您需要授予对 IAM 角色和 Lake Formation 服务加密或解密密密钥的权限。

  • 默认的 Lake Formation SLR 角色不能用于加密的受管理表。您必须在 Amazon S3 中使用自定义 IAM 角色,Amazon KMS和 CloudWatch 政策。

  • 使用Amazon Web Services Management Console,你必须使用 Lake Formation 控制台。你不能使用Amazon Glue控制台。

  • 数据压缩仅支持带有 Parquet 格式文件的分区表。

  • 您不能将现有的非受管理表转换为受管理的表,也不能将现有的受管理表转换为不受管辖的表。

  • Amazon Glue爬虫不支持受管理的表。

  • 你不能使用 Apache Spark DataFrames 从受监管的表中读取和写入数据。

  • 不支持向下推动谓词Amazon GlueETL。

  • 如果在 30 分钟内主动写入 250 多个分区,则数据压缩可能需要比平常更长的时间。

  • 使用动态帧读取受管表时,不支持以下功能:Amazon GlueETL:

  • 以下Amazon Glue不允许对受管理的表进行 API 操作:

    • CreatePartition

    • BatchCreatePartition

    • UpdatePartition

    • BatchUpdatePartitions

    • DeletePartition

    • BatchDeletePartition

    • GetPartition

    • BatchGetPartition

    这些限制的原因是,必须使用支持事务的 API 操作对受管理的表执行分区操作。有关更多信息,请参阅 。受管理的表对象 API.

    此外,还有限制UpdateTableAPI 操作。您无法更新表类型、更改分区键或更改表位置。

  • 在 Amazon S3 中创建受管理表清单中的对象并将其添加到受管理的表中之后,应该被修改。尽管 Amazon S3 允许多次写入对象,但 Lake Formation 假设数据湖中的对象已写入一次。

  • 一次只能将 Amazon S3 对象添加到单个受管理的表中。强烈建议将多个活动事务中的同一 Amazon S3 对象添加到多个受管辖的表中。