使用 Amazon Serverless Application Repository 部署数据源连接器 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 Amazon Serverless Application Repository 部署数据源连接器

要部署数据源连接器,可以使用 Amazon Serverless Application Repository,而非从 Athena 控制台开始。使用 Amazon Serverless Application Repository 找到要使用的连接器,提供连接器所需的参数,然后将连接器部署到您的账户。部署连接器后,您可以使用 Athena 控制台向 Athena 提供数据来源。

将连接器部署到您的账户

使用 Amazon Serverless Application Repository 将数据源连接器部署到您的账户
  1. 登录 Amazon Web Services Management Console并打开 Serverless App Repository (无服务器应用程序存储库)

  2. 在导航窗格中,选择 Available applications (可用应用程序)

  3. 选择 Show apps that create custom IAM roles or resource policies(显示创建自定义 IAM 角色或资源策略的应用程序)选项。

  4. 在搜索框中,键入连接器的名称。有关预构建的 Athena 数据连接器的列表,请参阅 可用数据来源连接器

  5. 选择连接器的名称。选择连接器后会打开 Amazon Lambda 控制台中 Lambda 函数的 Application details(应用程序详细信息)页面。

  6. 在详细信息页面的右侧,为 Application settings(应用程序设置)填写必填信息。最少的必填设置包括以下项。有关适用于 Athena 所构建的数据连接器的其余可配置选项的信息,请参阅 GitHub 上相应的 Available connectors(可用连接器)主题。

    • AthenaCatalogName – 指明其目标数据源的小写 Lambda 函数名称,例如 cloudwatchlogs

    • SpillBucket – 在您的账户指定一个 Amazon S3 存储桶,用于接收来自超出 Lambda 函数响应大小限制的任何大型响应有效负载的数据。

  7. 选中 I acknowledge that this app creates custom IAM roles and resource policies(我确认此应用程序创建自定义 IAM 角色和资源策略)。有关更多信息,请选择 Info (信息) 链接。

  8. Application settings(应用程序设置)部分的右下角,选择 Deploy(部署)。部署完成后,Lambda 函数将显示在 Lambda 控制台中的 Resource(资源)部分。

使连接器在 Athena 中可用

现在您可以使用 Athena 控制台使数据源连接器对 Athena 可用。

使数据源连接器对 Athena 可用
  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 如果控制台导航窗格不可见,请选择左侧的扩展菜单。

    选择扩展菜单。
  3. 在导航窗格中,选择 Data sources(数据来源)。

  4. Data sources(数据源)页面上,选择 Create data source(创建数据源)。

  5. 对于 Choose a data source(选择数据源),选择您在 Amazon Serverless Application Repository 中创建了连接器的数据源。本教程使用 Amazon CloudWatch Logs 作为联合数据源。

  6. 选择下一步

  7. Enter data source details(输入数据源详细信息)页面中,对于 Data source name(数据源名称),请输入从 Athena 查询数据源时要在 SQL 语句中使用的名称(例如 CloudWatchLogs)。名称最多可以包括 127 个字符,并且在您的账户中必须是唯一的。它在创建后即无法更改。有效字符包括 a-z、A-Z、0-9、_(下划线)、@(at 符号)和 -(连字符)。名称 awsdatacataloghivejmxsystem 是 Athena 预留的名称,无法用于数据源名称。

  8. Connection details(连接详细信息)部分中,请使用 Select or enter a Lambda function(选择或输入 Lambda 函数)框以选择刚创建的函数名称。将显示 Lambda 函数的 ARN。

  9. (可选)对于 Tags(标签),添加要与此数据源关联的键值对。有关标签的更多信息,请参阅 为 Athena 资源添加标签

  10. 选择下一步

  11. Review and create(审核和创建)页面中,查看数据源的详细信息,然后选择 Create data source(创建数据源)。

  12. 数据源此页面的 Data source details(数据源详细信息)部分显示了有关新连接器的信息。现在,您可以在 Athena 查询中使用连接器。

    有关在查询中使用数据连接器的信息,请参阅 编写联合查询