部署连接器和连接到数据源 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

部署连接器和连接到数据源

准备创建联合查询是一个分为两部分的过程:部署 Lambda 函数数据源连接器和将 Lambda 函数连接到数据源。在第一部分中,您可以为 Lambda 函数指定一个名称,以后可以在 Athena 控制台中选择该名称。在第二部分中,为连接器指定一个可以在 SQL 查询中引用的名称。

第 1 部分:部署数据源连接器

要选择、命名和部署数据源连接器,请在集成过程中使用 Athena 和 Lambda 控制台。

注意

部署数据源连接器

  1. https://console.amazonaws.cn/athena/ 打开 Athena 控制台。

  2. 执行以下任一操作:

    • 在 Query Editor (查询编辑器) 导航窗格中,选择 Connect data source (连接数据源)。

      
                                    在导航窗格中选择 Connect data source (连接数据源)。
    • 选择 Data sources (数据源) 选项卡,然后选择 Connect data source (连接数据源)。

      
                                    在 Data sources (数据源) 选项卡上,选择 Connect data source (连接数据源)。
  3. Connect data source (连接数据源) 页面上,选择 Query a data source (查询数据源)

  4. 对于 Choose a data source (选择数据源),请选择要使用 Athena 查询的数据源,例如 Amazon CloudWatch Logs

  5. 选择 Next

  6. 对于 Lambda function (Lambda 函数),请选择 Configure new function (配置新函数)。您选择的连接器的函数页将在 Lambda 控制台中打开。该页面包括连接器的详细信息。

  7. Application settings (应用程序设置) 下,输入所需信息。这至少包括:

    • AthenaCatalogName – 指明其目标数据源的 Lambda 函数的名称,例如 cloudwatchlogs

    • SpillBucket – 您的账户中用于存储超出 Amazon S3 函数响应大小限制的数据的 Lambda 存储桶。

  8. 选择 I acknowledge that this app creates custom IAM roles (我确认此应用程序创建自定义 IAM 角色)。有关更多信息,请选择 Info (信息) 链接。

  9. 选择 Deploy 控制台的 Resources (资源Lambda) 部分显示连接器的部署状态,并在部署完成后通知您。

第 2 部分:连接到数据源

将数据源连接器部署到您的账户后,可以将其连接到数据源。

使用已部署到账户的连接器连接到数据源

  1. https://console.amazonaws.cn/athena/ 打开 Athena 控制台。

  2. 选择 Connect data source (连接数据源)

    执行以下任一操作:

    • 在 Query Editor (查询编辑器) 导航窗格中,选择 Connect data source (连接数据源)。

    • 选择 Data sources (数据源) 选项卡,然后选择 Connect data source (连接数据源)。

  3. 选择 Query a data source (查询数据源)

  4. 为您刚部署的连接器选择数据源,例如 Amazon CloudWatch Logs。如果您使用 Athena Query Federation SDK 创建自己的连接器并已将其部署到您的账户,请选择 All other data sources (所有其他数据源)

  5. 选择 Next

  6. 对于 Choose Lambda function (选择 Lambda 函数),请选择您命名的函数。此时将显示 Lambda 函数的 ARN。

  7. 对于 Catalog name (目录名称),请输入 SQL 查询中的数据源要使用的唯一名称,例如 cloudwatchlogs。名称最多可以包括 127 个字符,并且在您的账户中必须是唯一的。它在创建后即无法更改。有效字符包括 a-z、A-Z、0-9、_(下划线)、@(& 符)和 -(连字符)。名称 awsdatacataloghivejmxsystem 是 Athena 预留的,无法用于自定义目录名称。

  8. 选择 ConnectData sources (数据源) 页面现在会在目录名称列表中显示您的连接器。现在,您可以在查询中使用连接器。

    有关编写带数据连接器的查询的信息,请参阅编写联合查询