注意事项
将 Amazon EMR 与 Amazon Lake Formation 结合使用时,请注意以下事项。
-
具有表访问权限的用户可以访问该表的所有属性。如果您对表具有基于 Lake Formation 的访问控制,则请查看该表以确保属性不包含任何敏感数据或信息。
-
当 Spark 收集表统计数据时,带有 Lake Formation 的 Amazon EMR 集群不支持 Spark 回退到 HDFS。这通常有助于优化查询性能。
-
在不受监管的 Apache Spark 和 Apache Hive 上支持基于 Lake Formation 的访问控制的操作(自 Amazon EMR 6.10.0 和更高版本起)包括
insert into
和insert overwrite
。 -
通过 Apache Spark 和 Apache Hive 支持基于 Lake Formation 的访问控制的操作包括
select
、describe
、show database
、show table
、show column
和show partition
。 -
Amazon EMR 不支持控制对以下基于 Lake Formation 的操作的访问:
-
写入受监管表
-
Lake Formation 数据筛选条件
-
DDL 语句,例如 CREATE 或 ALTER 表
-
-
使用和不使用基于 Lake Formation 的访问控制的同一查询之间存在性能差异。