Amazon Web Services 服务 与 Athena 的集成 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Web Services 服务 与 Athena 的集成

您可以使用 Athena 查询本节中所列 Amazon Web Services 服务 中的数据。要查看每个服务支持的区域,请参阅 Amazon Web Services 一般参考 中的区域和端点

请参阅下面几节,了解有关每个整合的信息。

Amazon CloudFormation
容量预留

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::CapacityReservation

使用提供的名称和请求的数据处理器数量指定容量预留。有关更多信息,请参阅《Amazon Athena 用户指南》中的 管理查询处理容量Amazon Athena API 参考中的 CreateCapacityReservation

数据目录

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::DataCatalog

指定 Athena 数据目录,包括名称、描述、类型、参数和标签。有关更多信息,请参阅《Amazon Athena 用户指南》中的 了解 Athena 中的表、数据库和数据目录Amazon Athena API 参考中的 CreateDataCatalog

命名查询

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::NamedQuery

通过 Amazon CloudFormation 指定命名查询,然后在 Athena 中运行它们。命名查询允许您将查询名称映射到查询,然后从 Athena 控制台将其作为保存的查询运行。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用已保存的查询Amazon Athena API 参考中的 CreateNamedQuery

预准备语句

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::PreparedStatement

指定一个用于 Athena 中的 SQL 查询的预编译语句。预准备语句包含参数占位符,其值在执行时提供。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用参数化查询Amazon Athena API 参考中的 CreatePreparedStatement

工作组

参考主题:《Amazon CloudFormation 用户指南》中的 Amazon::Athena::WorkGroup

使用 Amazon CloudFormation 指定 Athena 工作组。使用 Athena 工作组可将您或您的组的查询,与同一账户中的其他查询隔离开来。有关更多信息,请参阅《Amazon Athena 用户指南》中的 使用工作组控制查询访问和成本Amazon Athena API 参考中的 CreateWorkGroup

Amazon CloudFront

参考主题:查询 Amazon CloudFront 日志

使用 Athena 查询 Amazon CloudFront 日志。有关使用 CloudFront 的更多信息,请参阅《Amazon CloudFront 开发人员指南》。

Amazon CloudTrail

参考主题:查询 Amazon CloudTrail日志

将 Athena 与 CloudTrail 日志结合使用是加强对 Amazon 服务活动进行分析的强有力方法。例如,您可以使用查询来确定趋势,并根据属性(如源 IP 地址或用户)进一步隔离活动。您可以自动创建表,用于直接从 CloudTrail 控制台查询日志,并将这些表用于在 Athena 中运行查询。有关更多信息,请参阅 使用 CloudTrail 控制台为 CloudTrail 日志创建 Athena 表

Amazon DataZone

参考主题:在 Athena 中使用 Amazon DataZone

使用 Amazon DataZone 跨组织边界大规模共享、搜索和发现数据。DataZone 简化了您在 Athena、Amazon Glue 和 Amazon Lake Formation 等 Amazon 分析服务中的体验。如果您在不同的数据来源中有大量数据,则可使用 Amazon DataZone 根据人员、数据和工具分组构建业务使用案例。

在 Athena 中,您可以使用查询编辑器来访问和查询 DataZone 环境。有关更多信息,请参阅 在 Athena 中使用 Amazon DataZone

Elastic Load Balancing

参考主题:查询应用程序负载均衡器日志

通过查询应用程序负载均衡器日志,您可以查看进出 Elastic Load Balancing 实例和后端应用程序的流量来源、延迟和传输字节。有关更多信息,请参阅 查询应用程序负载均衡器日志

参考主题:查询经典负载均衡器日志

查询经典负载均衡器日志,分析和了解传入和传出 Elastic Load Balancing 实例和后端应用程序的流量模式。您可以查看流量来源、延迟和传输字节。有关更多信息,请参阅 查询经典负载均衡器日志

Amazon EMR Studio

参考主题:在 EMR Studio 中使用 Amazon Athena SQL 编辑器

您可以在 EMR Studio 中使用 Athena 来开发和运行交互式查询。这样的话,您可以通过 Spark、Scala 和其他工作负载所用的相同 Amazon EMR 接口,使用 EMR Studio 在 Athena 上进行 SQL 分析。利用 EMR Studio 中的 Athena 集成,您可以执行以下任务:

  • 执行 Athena SQL 查询

  • 查看查询结果

  • 查看查询历史记录

  • 查看保存的查询

  • 执行参数化查询

  • 查看数据目录的数据库、表和视图

Amazon EMR Studio 不提供以下 Athena 功能:

  • 管理功能,例如创建或更新 Athena 工作组、数据来源或容量预留

  • Athena for Spark 或 Spark Notebooks

  • DataZone 集成

  • Step Functions

在所有可以使用 EMR Studio 和 Athena 的 Amazon Web Services 区域 中,都可以使用与 Athena 的 EMR Studio 集成。有关在 EMR Studio 中使用 Athena 的更多信息,请参阅《Amazon EMR 管理指南》中的 Use the Amazon Athena SQL editor in EMR Studio

Amazon Glue Data Catalog

参考主题:使用 Amazon Glue Data Catalog 连接数据

Athena 与 Amazon Glue Data Catalog 集成,后者为您在 Amazon S3 中的数据提供了持久元数据存储。这使您可以根据在您的整个 Amazon Web Services 账户中可用并与 Amazon Glue 的 ETL 和数据发现功能集成在一起的中央元数据存储来创建表和在 Athena 中查询数据。有关更多信息,请参阅 使用 Amazon Glue Data Catalog 连接数据 和《Amazon Glue 开发人员指南》中的什么是 Amazon Glue

Amazon Identity and Access Management (IAM)

参考主题:Amazon Athena 的操作

您可在 IAM 权限策略中使用 Athena API 操作。有关更多信息,请参阅 Amazon Athena 的操作Athena 中的 Identity and Access Management

Amazon Quick

参考主题:通过 ODBC 和 JDBC 驱动程序连接到 Amazon Athena

Athena 与 Amazon Quick 集成,轻松实现数据可视化。您可以使用 Athena 生成报表,或借助商业智能工具或 SQL 客户端浏览数据(通过 JDBC 或 ODBC 驱动程序进行连接)。有关 Quick 的更多信息,请参阅《Amazon Quick 用户指南》中的什么是 Amazon Quick?。有关将 JDBC 和 ODBC 驱动程序与 Athena 一起使用的信息,请参阅通过 ODBC 和 JDBC 驱动程序连接到 Amazon Athena

Simple Storage Service (Amazon S3) 清单

参考主题:《Amazon Simple Storage Service 用户指南》中的使用 Athena 查询清单

您可以使用 Amazon Athena 通过标准 SQL 来查询 Amazon S3 清单。出于业务、合规性和法规要求,您可以使用 Amazon S3 清单来审计和报告对象的复制和加密状态。有关更多信息,请参阅《Amazon Simple Storage Service 用户指南》中的 Amazon S3 清单

Amazon Step Functions

参考主题:《Amazon Step Functions 开发人员指南》中的使用 Step Functions 调用 Athena

使用 Amazon Step Functions 调用 Athena。Amazon Step Functions 可以使用 Amazon States Language 直接控制 Amazon Web Services 服务 选择。您可以将 Step Functions 与 Athena 结合使用,以启动和停止查询执行、获取查询结果、运行临时或计划数据查询,以及从 Amazon S3 中的数据湖检索结果。Step Functions 角色必须有权使用 Athena。有关更多信息,请参见 Amazon Step Functions 开发人员指南

有关使用 Step Functions 和 Amazon EventBridge 编排 Amazon Glue DataBrew、Athena 和 Amazon Quick 的示例,请参阅 Amazon 大数据博客中的 Orchestrating an Amazon Glue DataBrew job and Amazon Athena query with Amazon Step Functions

Amazon Systems Manager 清单

参考主题:《Amazon Systems Manager 用户指南》中的查询多个区域和账户的清单数据

Amazon Systems Manager Inventory 与 Amazon Athena 集成,可帮助您从多个 Amazon Web Services 区域 和账户中查询清单数据。有关更多信息,请参阅 Amazon Systems Manager 用户指南

Amazon Virtual Private Cloud

参考主题:查询 Amazon VPC 流日志

Amazon Virtual Private Cloud 流日志捕获有关在 VPC 中传入和传出网络接口的 IP 流量的信息。查询 Athena 中的日志,调查网络流量模式,并识别 Amazon VPC 网络中的威胁和风险。有关 Amazon VPC 的更多信息,请参阅《Amazon VPC 用户指南》。