使用 Amazon Serverless Application Repository 部署 Hive 数据源连接器 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Amazon Serverless Application Repository 部署 Hive 数据源连接器

您也可以使用Amazon Serverless Application Repository部署适用于 Hive 的 Athena 数据源连接器。选择要使用的连接器,提供连接器所需的参数,然后将连接器部署到您的账户。

使用 Amazon Serverless Application Repository 将适用于 Hive 的数据源连接器部署到您的账户

  1. 登录 Amazon Web Services Management Console并打开 Serverless App Repository (无服务器应用程序存储库)

  2. 在导航窗格中,选择 Available applications (可用应用程序)

  3. 选择选项显示创建自定义 IAM 角色或资源策略的应用

  4. 在搜索框中,键入下列连接器之一的名称。这两个应用程序具有相同的功能,仅在实施方面存在差异。您可以使用两者之一创建 Lambda 函数,将 Athena 连接到 Hive 元存储。

    • AthenaHiveMetastoreFunction— Uber Lambda 函数.jar文件。

    • AthenaHiveMetastoreFunctionWithLayer— Lambda 层和薄 Lambda 函数.jar文件。

  5. 选择连接器的名称。

    
                    选择适用于 Hive 的 Athena 数据源连接器的名称。
  6. UNDER应用程序设置中,输入 Lambda 函数的参数。

    • Lambda 函数名称— 提供函数的名称。例如,myHiveMetastore

    • 溢出位置— 在此账户中指定一个 Amazon S3 位置,以便在 Lambda 函数响应大小超过 4MB 时保存溢出元数据。

    • HMSURI— 输入您的 Hive 元数据仓主机的 URI,该主机在端口 9083 使用 Thrift 协议。使用语法thrift://<host_name>:9083

    • 兰姆·达默莫里— 指定从 128MB 到 3008MB 的值。Lambda 函数分配与您配置的内存量成比例的 CPU 周期。默认值为 1024。

    • LambdImage— 指定允许的最大 Lambda 调用运行时间(以秒为单位),从 1 到 900(900 秒为 15 分钟)。默认值为 300 秒(5 分钟)。

    • VpcSecurityGroupIds— 输入 Hive 元存储的 VPC 安全组 ID 的逗号分隔的逗号分隔列表。

    • VpcSubneIds— 输入 Hive 元存储的 VPC 子网 ID 的逗号分隔的逗号分隔列表。

  7. 在右下角应用程序详细信息页面上,选择我确认此应用程序创建自定义 IAM 角色,然后选择部署

此时,您可以将 Athena 配置为使用 Lambda 函数连接到 Hive 元数据仓。有关更多信息,请参阅将 Athena 连接到 Apache Hive 元存储