使用 Apache Impala 数据来源创建数据集 - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 Apache Impala 数据来源创建数据集

Apache Impala 是一款高性能大规模并行处理 (MPP) SQL 查询引擎,旨在在 Apache Hadoop 上原生运行。使用以下过程在 Amazon QuickSight 和 Apache Impala 之间建立安全连接。

Amazon QuickSight 和 Apache Impala 之间的所有流量都使用 SSL 加密。QuickSight 支持 Impala 连接的标准用户名和密码身份验证。

要建立连接,您需要在 Impala 实例中配置 SSL 设置,准备身份验证凭证,使用 Impala 服务器详细信息在 Amazon QuickSight 中设置连接,并验证连接以确保数据访问安全。

使用 Apache Impala 数据来源创建数据集
  1. 从 Amazon QuickSight 起始页上,选择数据集

  2. 数据集页面上,选择新数据集

  3. 来自新数据来源部分中,选择 Impala

  4. 输入数据来源的名称。

  5. 对于公共连接:

    1. 输入数据库服务器HTTP 路径端口用户名密码的连接详细信息。

    2. 验证成功后,选择创建数据来源

  6. 对于私有连接:

    1. 在输入连接详细信息之前,请与管理员协调以设置 VPC 连接。

      您或您的管理员可以在 QuickSight 中配置 VPC 连接。SSL 默认启用,以确保数据传输安全。如果遇到连接验证错误,请验证连接和 VPC 详细信息。

      如果问题仍然存在,请咨询管理员以确认证书颁发机构包含在 QuickSight 的批准证书列表中。

  7. 选择您的表菜单中,您可以:

    1. 选择特定架构或表,然后选择选择

    2. 选择使用自定义 SQL 来编写您自己的 SQL 查询。

  8. 完成选择后,您将被重定向到数据准备页面。对数据进行任何调整,然后选择发布和可视化以在 QuickSight 中分析 Impala 数据。

注意

此连接器支持:

  • 用户名和密码身份验证

  • 公共和私有连接

  • 表发现和自定义 SQL 查询

  • 摄取期间的完整数据刷新

  • 仅限 SPICE 存储