部署连接器和连接到数据源 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

部署连接器和连接到数据源

准备创建联合查询是一个分为两部分的过程:部署 Lambda 函数数据源连接器和将 Lambda 函数连接到数据源。在第一部分中,您可以为 Lambda 函数指定一个名称,以后可以在 Athena 控制台中选择该名称。在第二部分中,为连接器指定一个可以在 SQL 查询中引用的名称。

注意

若要将 Athena 联合查询功能与Amazon Secrets Manager,您必须为 Secrets Manager 配置 Amazon VPC 私有终端节点。有关更多信息,请参阅 。创建 SSecrets Manager VPC 私有终端节点中的Amazon Secrets Manager用户指南

第 1 部分:部署数据源连接器

要选择、命名和部署数据源连接器,请在集成过程中使用 Athena 和 Lambda 控制台。

注意

要使用 Amazon Athena 联合查询功能,请将您的工作组设置为 Athena 引擎版本 2。要查看相关步骤,请参阅 更改 Athena 引擎版本

部署数据源连接器

  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 请执行下列操作之一:

    • 在查询编辑器导航窗格中,选择Connect 数据源

      
                                    选择Connect 数据源在导航窗格中。
    • 选择数据源选项卡,然后选择Connect 数据源

      
                                    在存储库的数据源选项卡上,选择Connect 数据源。
  3. Connect data source (连接数据源) 页面上,选择 Query a data source (查询数据源)

  4. 适用于选择数据源中,选择要使用 Athena 查询的数据源,例如Amazon CloudWatch Logs

  5. 选择 Next (下一步)

  6. 适用于Lambda 函数中,选择配置新Amazon Lambdafunction。您选择的连接器的函数页将在 Lambda 控制台中打开。该页面包括连接器的详细信息。

  7. UNDER应用程序设置,请仔细阅读每个应用程序设置的说明,然后输入符合您要求的值。

    注意

    您看到的应用程序设置因数据源的连接器而异。Amazon Redshift、MySQL 和 PostgreSQL 选项使用 Amazon Athena 连接器来实现符合 JDBC 标准的数据源。有关更多信息,请参阅 。Amazon Athena Lambda JDBC 连接器(位于 GitHub 上)。

    所需的最低设置包括:

    • 雅典名称— Lambda 函数的名称,指明其目标数据源,例如cloudwatchlogs

    • SpillBucket— 您账户中的 Amazon S3 存储桶,用于存储超出 Lambda 函数响应大小限制的数据。

  8. 选择 I acknowledge that this app creates custom IAM roles (我确认此应用程序创建自定义 IAM 角色)。有关更多信息,请选择 Info (信息) 链接。

  9. 选择 Deploy (部署)。这些区域有:资源部分显示连接器的部署状态,并在部署完成时通知您。

第 2 部分:连接到数据源

将数据源连接器部署到您的账户后,可以将其连接到数据源。

使用已部署到账户的连接器连接到数据源

  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 选择 Connect data source (连接数据源)

    请执行下列操作之一:

    • 在查询编辑器导航窗格中,选择Connect 数据源

    • 选择数据源选项卡,然后选择Connect 数据源

  3. 选择 Query a data source (查询数据源)

  4. 为您刚部署的连接器选择数据源,例如Amazon CloudWatch Logs。如果您使用 Athena 查询联合 SDK 创建自己的连接器并已将其部署到您的账户,请选择所有其他数据源

  5. 选择 Next (下一步)

  6. 适用于选择 Lambda 函数中,选择您命名的函数。此时将显示 Lambda 函数的 ARN。

  7. 对于 Catalog name (目录名称),请输入 SQL 查询中的数据源要使用的唯一名称,例如 cloudwatchlogs。名称最多可以包括 127 个字符,并且在您的账户中必须是唯一的。它在创建后即无法更改。有效字符包括 a-z、A-Z、0-9、_(下划线)、@(& 符)和 -(连字符)。名称awsdatacataloghivejmx, 和system是 Athena 预留的,无法用于自定义目录名称。

  8. 选择 Connect (连接)Data sources (数据源) 页面现在会在目录名称列表中显示您的连接器。现在,您可以在查询中使用连接器。

    有关编写带数据连接器的查询的信息,请参阅编写联合查询