Amazon EMR 集成的已知问题

已知问题

Amazon EMR 发行版 5.32 中存在一个已知问题，其中更改了 hive-site.xml 的权限，以便只有特权用户才能读取它，因为其中可能存储了凭证。这可能会阻止 Hue 读取 hive-site.xml 并导致网页不断重新加载。如果遇到此问题，请添加以下配置来修复此问题：


[
  {
    "Classification": "hue-ini",
    "Properties": {},
    "Configurations": [
      {
        "Classification": "desktop",
        "Properties": {
          "server_group":"hive_site_reader"
         },
        "Configurations":[
        ]
      }
    ]
  }
]

一个已知的问题是适用于 Apache Ranger 的 EMRFS S3 插件当前不支持 Apache Ranger 的安全区功能。使用安全区功能定义的访问控制限制不适用于您的 Amazon EMR 集群。

应用程序 UIs

默认情况下，应用程序 UI 不执行身份验证。这包括ResourceManager 用户界面、 NodeManager 用户界面、Livy 用户界面等。此外，任何能够访问的 UIs 用户都可以查看有关所有其他用户工作的信息。

如果不希望出现这种行为，则应确保使用安全组来限制用户对应用程序 UIs 的访问。

HDFS 原定设置的权限

默认情况下，用户在 HDFS 中创建的对象被授予全局可读权限。这可能会导致无权访问数据的用户也可以读取数据。要更改此行为，以便将默认文件权限设置为仅由任务创建者读取和写入，请执行以下步骤。

创建 EMR 集群时，请提供以下配置：


[
  {
    "Classification": "hdfs-site",
    "Properties": {
      "dfs.namenode.acls.enabled": "true",
      "fs.permissions.umask-mode": "077",
      "dfs.permissions.superusergroup": "hdfsadmingroup"
    }
  }
]

此外，运行以下引导操作：


--bootstrap-actions Name='HDFS UMask Setup',Path=s3://elasticmapreduce/hdfs/umask/umask-main.sh

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

配置 Zeppelelin

适用于 Amazon EMR 集成场景的 Apache Ranger 插件