将 Amazon EMR 与 Lake Formation 结合使用时的注意事项 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将 Amazon EMR 与 Lake Formation 结合使用时的注意事项

将 Amazon EMR 与配合使用时,请考虑以下几点。 Amazon Lake Formation

  • 表级访问控制在 Amazon EMR 6.13 及更高版本的集群上可用。

  • 行、列和单元格级别的精细访问控制在 Amazon EMR 6.15 及更高版本的集群上可用。

  • 具有表访问权限的用户可以访问该表的所有属性。如果您对表具有基于 Lake Formation 的访问控制,则请查看该表以确保属性不包含任何敏感数据或信息。

  • 当 Spark 收集表统计数据时,带有 Lake Formation 的 Amazon EMR 集群不支持 Spark 回退到 HDFS。这通常有助于优化查询性能。

  • 通过不受监管的 Apache Spark 表支持基于 Lake Formation 的访问控制的操作包括 INSERT INTOINSERT OVERWRITE

  • 通过 Apache Spark 和 Apache Hive 支持基于 Lake Formation 的访问控制的操作包括 SELECTDESCRIBESHOW DATABASESHOW TABLESHOW COLUMNSHOW PARTITION

  • Amazon EMR 不支持对以下基于 Lake Formation 的操作进行访问控制:

    • 写入受监管表

    • Amazon EMR 不支持 CREATE TABLE。Amazon EMR 6.10.0 及更高版本支持 ALTER TABLE

    • INSERT 命令之外的 DML 语句。

  • 使用和不使用基于 Lake Formation 的访问控制的同一查询之间存在性能差异。