Hue on Amazon EMR 支持和不支持的功能 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Hue on Amazon EMR 支持和不支持的功能

在 Amazon EMR 7.0.0 及更高版本中,Hue 需要 Python 3.9 或更高版本。使用传输中加密时,您必须使用 2048 位密码密钥。

  • Amazon S3 和 Hadoop File System (HDFS) Browser

    • 通过适当的权限,您可以在临时 HDFS 存储和属于您账户的 S3 存储桶之间浏览和移动数据。

    • 默认情况下,Hue 中的超级用户可以访问允许 Amazon EMR IAM 角色访问的所有文件。新建用户不会自动拥有对 Amazon S3 filebrowser 的访问权限,并且必须为其组启用 filebrowser.s3_access 权限。

  • Hive — 对数据运行交互式查询。此外,这也是编程或批处理查询原型的一种有用方法。

  • Pig — 对数据运行脚本或发出交互式命令。

  • Oozie — 创建并监控 Oozie 工作流。

  • 元存储管理器 — 可用于查看和操作 Hive 元存储的内容(导入/创建、删除等)。

  • 任务浏览器 — 查看您提交的 Hadoop 作业的状态。

  • 用户管理 — 管理 Hue 账户并将 LDAP 用户与 Hue 集成。

  • Amazon 示例 — 有几个 “ready-to-run” 示例使用 Hue 中的应用程序处理来自各种 Amazon 服务的示例数据。登录 Hue 后,您将转到 Hue 应用程序主页,其中预安装了示例。

  • 仅 Amazon EMR 5.9.0 版或更高版本支持 Livy Server。

  • 要使用 Hue Notebook for Spark,您必须在 Hue 中安装 Livy 和 Spark。

  • Trino/Presto — Hue 支持连接到 Trino 和 Presto 数据服务器。在 Amazon EMR 7.0.0 及更高版本中,trino-python-clientpresto-python-client 连接器可以促进这种连接。低于 7.0.0 的发行版通过 JDBC 网关使用 JDBC 连接器。

  • 不支持 Hue 控制面板。

  • 不支持 PostgreSQL。