在 Athena 中注册 Redshift 数据目录
Athena 可以从 Amazon Glue Data Catalog 中注册的 Redshift 集群或无服务器命名空间中读取存储的数据以及将数据写入其中。这是与 Amazon Lake Formation 配合使用来实现的,后者提供集中式安全和治理,确保不同查询引擎之间的数据访问得到一致的管理,并保持对共享 Redshift 数据的精细访问控制。
注意事项和限制
-
实体化视图:可以从 Athena 查询 Amazon Redshift 实体化视图,但不支持使用 Athena 或 Spark 创建实体化视图。
-
不支持 DDL 操作,包括在 Amazon Redshift 托管式存储表上设置 Amazon Glue Data Catalog 配置和操作。
先决条件
从 Athena 查询 Amazon Glue 数据目录之前,请完成以下任务:
-
创建 Amazon Redshift 集群或无服务器命名空间并将其注册到 Amazon Glue Data Catalog。有关更多信息,请参阅《Amazon Redshift 管理指南》中的 Registering a cluster to the Amazon Glue Data Catalog 或 Registering namespaces to the Amazon Glue Data Catalog。
-
从注册的命名空间在 Amazon Lake Formation 中创建数据目录。有关更多信息,请参阅《Amazon Lake Formation 开发人员指南》中的 Creating Amazon Redshift federated catalogs。
-
(可选)使用 Lake Formation 设置对目录的精细访问控制。有关更多信息,请参阅《Amazon Lake Formation 开发人员指南》中的 Bringing your data into the Amazon Glue Data Catalog。
通过 Athena 控制台注册 Redshift 数据目录
要通过 Athena 控制台注册 Redshift 数据目录,请执行以下步骤。
-
从 https://console.aws.amazon.com/athena/
打开 Athena 控制台。 -
在导航窗格中,选择数据来源和目录。
-
在数据来源和目录页面上,选择创建数据来源。
-
在选择数据来源中,选择 Amazon S3 - Amazon Glue Data Catalog。
-
在 Amazon Glue Data Catalog 部分中,对于数据来源账户,选择此账户中的 Amazon Glue Data Catalog。
-
对于创建表或注册目录,请选择注册新 Amazon Glue 目录。
-
在数据来源详细信息部分中,对于数据来源名称,请输入用于在 SQL 查询中指定数据来源的名称,或者使用生成的默认名称。
-
对于目录,选择浏览来搜索同一账户中的 Amazon Glue 目录列表。如果您看不到任何现有的目录,请通过 Amazon Glue
控制台创建一个。 -
在浏览 Amazon Glue 目录对话框中,选择要使用的目录,然后选中选择。
-
(可选)对于标签,输入要与该数据来源关联的键值对。
-
选择下一步。
-
在检查并创建页面上,验证输入的信息是否正确,然后选择创建数据来源。