Amazon Web Service 与 Athena 的集成 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Web Service 与 Athena 的集成

您可以使用 Athena 查询本节中所列 Amazon Web Services 中的数据。要查看每个服务支持的区域,请参阅 Amazon Web Services 一般参考 中的区域和端点

请参阅下面几节,了解有关每个整合的信息。

Amazon CloudFormation
容量预留

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::CapacityReservation

使用提供的名称和请求的数据处理单元数量指定容量预留。有关更多信息,请参阅《Amazon Athena 用户指南》中的 管理查询处理容量Amazon Athena API 参考中的 CreateCapacityReservation

数据目录

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::DataCatalog

指定 Athena 数据目录,包括名称、描述、类型、参数和标签。有关更多信息,请参阅《Amazon Athena 用户指南》中的 了解表、数据库和数据目录Amazon Athena API 参考中的 CreateDataCatalog

命名查询

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::NamedQuery

通过 Amazon CloudFormation 指定命名查询,然后在 Athena 中运行它们。命名查询允许您将查询名称映射到查询,然后从 Athena 控制台将其作为保存的查询运行。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用已保存的查询Amazon Athena API 参考中的 CreateNamedQuery

预准备语句

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::PreparedStatement

指定一个用于 Athena 中的 SQL 查询的预编译语句。预准备语句包含参数占位符,其值在执行时提供。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用参数化查询Amazon Athena API 参考中的 CreatePreparedStatement

工作组

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::WorkGroup

使用 Amazon CloudFormation 指定 Athena 工作组。使用 Athena 工作组可将您或您的组的查询,与同一账户中的其他查询隔离开来。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用工作组控制查询访问和成本Amazon Athena API 参考中的 CreateWorkGroup

Amazon CloudFront

参考主题:查询 Amazon CloudFront 日志

使用 Athena 查询 Amazon CloudFront 日志。有关使用 CloudFront 的更多信息,请参阅《Amazon CloudFront 开发人员指南》。

Amazon CloudTrail

参考主题:查询 Amazon CloudTrail 日志

将 Athena 与 CloudTrail 日志结合使用是加强对 Amazon 服务活动进行分析的强有力方法。例如,您可以使用查询来确定趋势,并根据属性(如源 IP 地址或用户)进一步隔离活动。您可以自动创建表,用于直接从 CloudTrail 控制台查询日志,并将这些表用于在 Athena 中运行查询。有关更多信息,请参阅 使用 CloudTrail 控制台为 CloudTrail 日志创建 Athena 表

Amazon DataZone

参考主题:在 Athena 中使用 Amazon DataZone

使用 Amazon DataZone 跨组织边界大规模共享、搜索和发现数据。DataZone 简化了您在 Athena、Amazon Glue 和 Amazon Lake Formation 等 Amazon 分析服务中的体验。如果您在不同的数据来源中有大量数据,则可使用 Amazon DataZone 根据人员、数据和工具分组构建业务用例。

在 Athena 中,您可以使用查询编辑器来访问和查询 DataZone 环境。有关更多信息,请参阅 在 Athena 中使用 Amazon DataZone

Elastic Load Balancing

参考主题:查询 Application Load Balancer 日志

通过查询 Application Load Balancer 日志,您可以查看进出 Elastic Load Balancing 实例和后端应用程序的流量来源、延迟和传输字节。有关更多信息,请参阅 查询 Application Load Balancer 日志

参考主题:查询经典负载均衡器日志

查询经典负载均衡器日志,分析和了解传入和传出 Elastic Load Balancing 实例和后端应用程序的流量模式。您可以查看流量来源、延迟和传输字节。有关更多信息,请参阅为 ELB 日志创建表

Amazon EMR Studio

参考主题:在 EMR Studio 中使用 Amazon Athena SQL 编辑器

您可以在 EMR Studio 中使用 Athena 来开发和运行交互式查询。这样的话,您可以通过 Spark、Scala 和其他工作负载所用的相同 Amazon EMR 接口,使用 EMR Studio 在 Athena 上进行 SQL 分析。利用 EMR Studio 中的 Athena 集成,您可以执行以下任务:

  • 执行 Athena SQL 查询

  • 查看查询结果

  • 查看查询历史记录

  • 查看保存的查询

  • 执行参数化查询

  • 查看数据目录的数据库、表和视图

Amazon EMR Studio 不提供以下 Athena 功能:

  • 管理功能,例如创建或更新 Athena 工作组、数据来源或容量预留

  • Athena for Spark 或 Spark 笔记本

  • DataZone 集成

  • Step Functions

在所有可以使用 EMR Studio 和 Athena 的 Amazon Web Services 区域 中,都可以使用与 Athena 的 EMR Studio 集成。有关在 EMR Studio 中使用 Athena 的更多信息,请参阅《Amazon EMR 管理指南》中的 Use the Amazon Athena SQL editor in EMR Studio

Amazon Glue Data Catalog

参考主题:与 Amazon Glue 集成

Athena 与 Amazon Glue Data Catalog 集成,后者为您在 Amazon S3 中的数据提供了持久元数据存储。这使您可以根据在您的整个 Amazon Web Services 账户中可用并与 Amazon Glue 的 ETL 和数据发现功能集成在一起的中央元数据存储来创建表和在 Athena 中查询数据。有关更多信息,请参阅 与 Amazon Glue 集成 和《Amazon Glue 开发人员指南》中的什么是 Amazon Glue

Amazon Identity and Access Management (IAM)

参考主题:Amazon Athena 的操作

您可在 IAM 权限策略中使用 Athena API 操作。有关更多信息,请参阅 Amazon Athena 的操作Athena 中的 Identity and Access Management

Amazon QuickSight

参考主题:通过 ODBC 和 JDBC 驱动程序连接到 Amazon Athena

Athena 与 Amazon QuickSight 集成,轻松实现数据可视化。您可以使用 Athena 生成报表,或借助商业智能工具或 SQL 客户端浏览数据(通过 JDBC 或 ODBC 驱动程序进行连接)。有关 Amazon QuickSight 的更多信息,请参阅《Amazon QuickSight 用户指南》中的什么是 Amazon QuickSight。有关将 JDBC 和 ODBC 驱动程序与 Athena 一起使用的信息,请参阅通过 ODBC 和 JDBC 驱动程序连接到 Amazon Athena

Simple Storage Service (Amazon S3) 清单

参考主题:《Amazon Simple Storage Service 用户指南》中的使用 Athena 查询清单

您可以使用 Amazon Athena 通过标准 SQL 来查询 Amazon S3 清单。出于业务、合规性和法规要求,您可以使用 Amazon S3 清单来审计和报告对象的复制和加密状态。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的 Amazon S3 清单

Amazon Step Functions

参考主题:《Amazon Step Functions 开发人员指南》中的使用 Step 函数调用 Athena

使用 Amazon Step Functions 调用 Athena。Amazon Step Functions 可以使用 Amazon States Language 直接控制 Amazon Web Services 选择。您可以将 Step 函数与 Athena 结合使用,以启动和停止查询执行、获取查询结果、运行临时或计划数据查询,以及从 Amazon S3 中的数据湖检索结果。Step Functions 角色必须有权使用 Athena。有关更多信息,请参见 Amazon Step Functions 开发人员指南

有关使用 Step 函数和 Amazon EventBridge 编排 Amazon Glue DataBrew、Athena 和 Amazon QuickSight 的示例,请参阅 Amazon 大数据博客中的使用 Amazon Step Functions 编排 Amazon Glue DataBrew 任务和 Amazon Athena 查询

Amazon Systems Manager 清单

参考主题:《Amazon Systems Manager 用户指南》中的查询多个区域和账户的清单数据

Amazon Systems Manager Inventory 与 Amazon Athena 集成,可帮助您从多个 Amazon Web Services 区域 和账户中查询清单数据。有关更多信息,请参阅 Amazon Systems Manager 用户指南

Amazon Virtual Private Cloud

参考主题:查询 Amazon VPC 流日志

Amazon Virtual Private Cloud 流日志捕获有关在 VPC 中传入和传出网络接口的 IP 流量的信息。查询 Athena 中的日志,调查网络流量模式,并识别 Amazon VPC 网络中的威胁和风险。有关 Amazon VPC 的更多信息,请参阅《Amazon VPC 用户指南》。