在 Athena 中注册 Redshift 数据目录 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

在 Athena 中注册 Redshift 数据目录

Athena 可以从 Amazon Glue Data Catalog 中注册的 Redshift 集群或无服务器命名空间中读取存储的数据以及将数据写入其中。这是与 Amazon Lake Formation 配合使用来实现的,后者提供集中式安全和治理,确保不同查询引擎之间的数据访问得到一致的管理,并保持对共享 Redshift 数据的精细访问控制。

注意事项和限制

  • 实体化视图:可以从 Athena 查询 Amazon Redshift 实体化视图,但不支持使用 Athena 或 Spark 创建实体化视图。

  • 不支持 DDL 操作,包括在 Amazon Redshift 托管式存储表上设置 Amazon Glue Data Catalog 配置和操作。

先决条件

从 Athena 查询 Amazon Glue 数据目录之前,请完成以下任务:

  1. 创建 Amazon Redshift 集群或无服务器命名空间并将其注册到 Amazon Glue Data Catalog。有关更多信息,请参阅《Amazon Redshift 管理指南》中的 Registering a cluster to the Amazon Glue Data CatalogRegistering namespaces to the Amazon Glue Data Catalog

  2. 从注册的命名空间在 Amazon Lake Formation 中创建数据目录。有关更多信息,请参阅《Amazon Lake Formation 开发人员指南》中的 Creating Amazon Redshift federated catalogs

  3. (可选)使用 Lake Formation 设置对目录的精细访问控制。有关更多信息,请参阅《Amazon Lake Formation 开发人员指南》中的 Bringing your data into the Amazon Glue Data Catalog

通过 Athena 控制台注册 Redshift 数据目录

要通过 Athena 控制台注册 Redshift 数据目录,请执行以下步骤。

  1. https://console.aws.amazon.com/athena/ 打开 Athena 控制台。

  2. 在导航窗格中,选择数据来源和目录

  3. 数据来源和目录页面上,选择创建数据来源

  4. 选择数据来源中,选择 Amazon S3 - Amazon Glue Data Catalog

  5. Amazon Glue Data Catalog 部分中,对于数据来源账户,选择此账户中的 Amazon Glue Data Catalog

  6. 对于创建表或注册目录,请选择注册新 Amazon Glue 目录

  7. 数据来源详细信息部分中,对于数据来源名称,请输入用于在 SQL 查询中指定数据来源的名称,或者使用生成的默认名称。

  8. 对于目录,选择浏览来搜索同一账户中的 Amazon Glue 目录列表。如果您看不到任何现有的目录,请通过 Amazon Glue 控制台创建一个。

  9. 浏览 Amazon Glue 目录对话框中,选择要使用的目录,然后选中选择

  10. (可选)对于标签,输入要与该数据来源关联的键值对。

  11. 选择下一步

  12. 检查并创建页面上,验证输入的信息是否正确,然后选择创建数据来源