2020 年 11 月 11 日 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

2020 年 11 月 11 日

发布时间:2020-11-11

Amazon Athena 宣布在 美国东部(弗吉尼亚北部)、美国东部(俄亥俄州) 和 美国西部(俄勒冈) 区域中正式发布 和联合查询。

Amazon Athena 在 、美国东部(弗吉尼亚北部) 和 美国东部(俄亥俄州) 区域中宣布正式发布新的查询引擎版本 美国西部(俄勒冈)。

包括性能增强和新功能,例如 Parquet 格式数据的架构演进支持、额外的地理空间函数、对读取嵌套架构的支持以降低成本以及在 JOIN 和 AGGREGATE 操作中实现的性能增强。

联合 SQL 查询

您现在可以在 Athena、美国东部(弗吉尼亚北部) 和 美国东部(俄亥俄州) 区域中使用 美国西部(俄勒冈) 的联合查询,无需使用 AmazonAthenaPreviewFunctionality 工作组。

使用联合 SQL 查询跨关系数据源、非关系数据源、对象数据源和自定义数据源运行 SQL 查询。通过联合查询,您可以通过提交一个 SQL 查询,扫描来自本地运行或托管在云中的多个来源的数据。

由于如下原因,对分布在应用程序之间的数据进行分析可能很复杂且耗时:

  • 分析所需的数据通常分布在关系、键值、文档、内存、搜索、图形、对象、时间序列和分类账数据存储中。

  • 为了分析跨这些来源的数据,分析师需要构建复杂的管道,来将这些数据提取、转换和加载到数据仓库中,以便可以进行查询。

  • 访问各种来源中的数据需要学习新的编程语言和数据访问构造。

Athena 中的联合 SQL 查询允许用户在不移动数据的情况下进行查询,消除了这种复杂性。分析师可以使用熟悉的 SQL 构造跨多个数据源 JOIN 数据以进行快速分析,并将结果存储在 Amazon S3 中以备随后使用。

数据源连接器

为处理联合查询,Athena 使用在 AthenaAWS Lambda 上运行的 数据源连接器。以下开源预构建连接器已由 Athena 编写并测试。可以使用它们在 Athena 中对其相应的数据源运行 SQL 查询。

自定义数据源连接器

使用 Athena Query Federation SDK,开发人员可以构建到任何数据源的连接器,以使 Athena 能够针对该数据源运行 SQL 查询。AthenaQuery Federation Connector 将联合查询的优势扩展到 AWS 提供的连接器之外。由于连接器在 AWS Lambda 上运行,因此您不必管理基础设施或计划扩展以应对尖峰需求。

后续步骤