与 Amazon Glue 集成 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

与 Amazon Glue 集成

Amazon Glue 是一项完全托管式 ETL(提取、转换和加载)Amazon Web Service。其关键能力之一是对数据进行分析和分类。您可以使用 Amazon Glue 爬网程序自动从 Amazon S3 中的数据推断数据库和表架构,并将关联的元数据存储在 Amazon Glue Data Catalog。

Athena 使用 Amazon Glue Data Catalog 在您的亚马逊云科技账户中存储和检索 Amazon S3 数据的表元数据。通过表元数据,Athena 查询引擎可以了解如何查找、读取和处理您要查询的数据。

要在 Amazon Glue Data Catalog 中创建数据库和表架构,您可以在 Athena 中对数据源运行 Amazon Glue 爬网程序,或者您可以直接在 Athena 查询编辑器中运行数据定义语言 (DDL) 查询。然后,使用您创建的数据库和表架构,您可以使用 Athena 中的数据操作 (DML) 查询来查询数据。

您可以从不属于您自己的账户中注册 Amazon Glue Data Catalog。在您为 Amazon Glue 配置所需的 IAM 权限之后,就可以使用 Athena 运行跨账户查询。有关更多信息,请参阅授予 Amazon Glue 数据目录跨账户访问权限

有关 Amazon Glue Data Catalog 的更多信息,请参阅《Amazon Glue 开发人员指南》中的 Amazon Glue 中的数据目录和爬网程序

需单独支付 Amazon Glue 的费用。有关更多信息,请参阅 Amazon Glue 定价