2021 年 7 月 16 日 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

2021 年 7 月 16 日

发表于二零一一年七月二十六日

Amazon Athena 已经更新了与阿帕奇胡迪的集成。Hudi 是一种开源数据管理框架,用于简化 Amazon S3 数据湖中的增量数据处理。更新的集成使您能够使用 Athena 查询通过亚马逊 EMR、Apache Spark、Apache Hive 或其他兼容服务管理的 Hudi 0.8.0 表。此外,Athena 现在还支持两个附加功能:对读时合并 (MOR) 表进行快照查询,以及对引导表的读取支持。

Apache Hudi 提供记录级别的数据处理,可帮助您简化变更数据捕获 (CDC) 管道的开发,遵守 GDPR 驱动的更新和删除操作,并更好地管理来自需要数据插入和事件更新的传感器或设备的流数据。0.8.0 版本可以更轻松地将大型镶木地板表迁移到 Hudi,而无需复制数据,因此您可以通过 Athena 查询和分析它们。您可以使用 Athena 对快照查询的新支持来获得流表更新的近实时视图。

要了解有关将 Hudi 与 Athena 结合使用的更多信息,请参阅使用 Athena 查询阿帕奇胡迪数据集.