部署连接器和连接到数据源 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

部署连接器和连接到数据源

准备创建联合查询是一个分为两部分的过程:部署 Lambda 函数数据源连接器和将 Lambda 函数连接到数据源。在第一部分中,您可以为 Lambda 函数指定一个名称,以后可以在 Athena 控制台中选择该名称。在第二部分中,为连接器指定一个可以在 SQL 查询中引用的名称。

第 1 部分:部署数据源连接器

要选择、命名和部署数据源连接器,请在集成过程中使用 Athena 和 Lambda 控制台。

注意

To use this feature in preview, you must create an Athena workgroup named AmazonAthenaPreviewFunctionality and join that workgroup. For more information, see 管理工作组.

部署数据源连接器

  1. https://console.amazonaws.cn/athena/ 打开 Athena 控制台。

  2. 选择 Connect data source (连接数据源)

  3. Connect data source (连接数据源) 页面上,选择 Query a data source (查询数据源)

  4. 对于 Choose a data source (选择数据源),请选择要使用 Athena 查询的数据源,例如 Amazon CloudWatch Logs

  5. 选择 Next

  6. 对于 Lambda function (Lambda 函数),请选择 Configure new function (配置新函数)。您选择的连接器的函数页将在 Lambda 控制台中打开。该页面包括连接器的详细信息。

  7. Application settings (应用程序设置) 下,输入所需信息。这至少包括:

    • AthenaCatalogName – 指明其目标数据源的 Lambda 函数的名称,例如 cloudwatchlogs

    • SpillBucket – 您的账户中用于存储超出 Lambda 函数响应大小限制的数据的 Amazon S3 存储桶。

  8. 选择 I acknowledge that this app creates custom IAM roles (我确认此应用程序创建自定义 IAM 角色)。有关更多信息,请选择 Info (信息) 链接。

  9. 选择 Deploy (部署)。Lambda 控制台的 Resources (资源) 部分显示连接器的部署状态,并在部署完成时通知您。

第 2 部分:连接到数据源

将数据源连接器部署到您的账户后,可以将其连接到数据源。

使用已部署到账户的连接器连接到数据源

  1. https://console.amazonaws.cn/athena/ 打开 Athena 控制台。

  2. 选择 Connect data source (连接数据源)

  3. 选择 Query a data source (查询数据源)

  4. 为您刚部署的连接器选择数据源,例如 Amazon CloudWatch Logs。如果您使用 Athena Query Federation SDK 创建自己的连接器并已将其部署到您的账户,请选择 All other data sources (所有其他数据源)

  5. 选择 Next

  6. 对于 Choose Lambda function (选择 Lambda 函数),请选择您命名的函数。此时将显示 Lambda 函数的 ARN。

  7. 对于 Catalog name (目录名称),请输入 SQL 查询中的数据源要使用的唯一名称,例如 cloudwatchlogs。名称最多可以包括 127 个字符,并且在您的账户中必须是唯一的。它在创建后即无法更改。有效字符包括 a-z、A-Z、0-9、_(下划线)、@(& 符)和 -(连字符)。

  8. 选择 ConnectData sources (数据源) 页面现在会在目录名称列表中显示您的连接器。现在,您可以在查询中使用连接器。

    有关编写带数据连接器的查询的信息,请参阅编写联合查询