2020 年 11 月 11 日 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

2020 年 11 月 11 日

发布时间:2020 年 11 月 11 日

Amazon Athena 宣布在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)和美国西部(俄勒冈)区域可用于 Athena 引擎版本 2 和联合查询。

Athena 引擎版本 2

Amazon Athena 宣布在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)和美国西部(俄勒冈)区域将公开发布。

Athena 引擎版本 2 包括性能增强和新功能功能,例如对镶木地板格式数据的架构演变支持、附加的地理空间函数、支持读取嵌套架构以降低成本以及 JOIN 和 CORIE 操作中的性能增强。

联合 SQL 查询

现在,您可以在美国东部(弗吉尼亚北部)、美国东部(俄亥俄)和美国西部(俄勒冈)区域中使用 Athena 的联合查询,而无需使用AmazonAthenaPreviewFunctionality工作组。

使用联合 SQL 查询跨关系数据源、非关系数据源、对象数据源和自定义数据源运行 SQL 查询。通过联合查询,您可以通过提交一个 SQL 查询,扫描来自本地运行或托管在云中的多个来源的数据。

由于如下原因,对分布在应用程序之间的数据进行分析可能很复杂且耗时:

  • 分析所需的数据通常分布在关系、键值、文档、内存、搜索、图形、对象、时间序列和分类账数据存储中。

  • 为了分析跨这些来源的数据,分析师需要构建复杂的管道,来将这些数据提取、转换和加载到数据仓库中,以便可以进行查询。

  • 访问各种来源中的数据需要学习新的编程语言和数据访问构造。

Athena 中的联合 SQL 查询允许用户在不移动数据的情况下进行查询,消除了这种复杂性。分析人员可以使用熟悉的 SQL 结构来JOIN数据跨多个数据源进行快速分析,并将结果存储在 Amazon S3 中以备随后使用。

数据源连接器

若要处理联合查询,Athena 使用 Athena 数据源连接器运行在Amazon Lambda。以下开源、预构建的连接器由 Athena 编写和测试。使用它们在 Athena 中对其对应的数据源运行 SQL 查询。

自定义数据源连接器

使用Athena 查询联合软件开发工具包,开发人员可以建立与任何数据源的连接器,以使 Athena 能够针对该数据源运行 SQL 查询。Athena 查询联合连接器使得联合查询的优势超越了Amazon提供的连接器。由于连接器在 Amazon Lambda 上运行,因此您不必管理基础设施或计划扩展以应对尖峰需求。

后续步骤