升级到Amazon Glue Data Catalog分步 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

升级到Amazon Glue Data Catalog分步

目前,所有支持 Athena 的区域也支持 Athena 的区域Amazon Glue Data Catalog。数据库和表可供 Athena 使用Amazon Glue Data Catalog反之亦然.

如果在某区域支持之前,您使用 Athena 或 Amazon Redshift Spectrum 创建了数据库和表。Amazon Glue,您可以升级 Athena 以使用Amazon Glue Data Catalog。

如果您使用的是较旧的 Athena 托管数据目录,则会在控制台顶部看到升级选项。雅典娜托管目录中的元数据在Amazon Glue Data Catalog反之亦然. 虽然目录并排存在,但无法在Amazon Glue或者 Athena。这可在您执行升级时防止名称冲突。有关使用Amazon Glue Data Catalog,请参阅常见问题:升级到Amazon Glue Data Catalog

Athena 控制台中的向导可指导您完成升级到Amazon Glue控制台。升级只需几分钟的时间,并且您可以在停止的位置恢复操作。有关每个升级步骤的信息,请参阅此部分中的各个主题。

有关使用数据和表的信息,请参阅Amazon Glue Data Catalog,请参阅将 Athena 与一起使用时的最佳实践Amazon Glue

步骤 1 – 允许用户执行升级

默认情况下,允许用户执行升级的操作在任何策略 (包括任何托管策略) 中都是不允许的。由于Amazon Glue Data Catalog在整个帐户中都是共享的,则此额外的故障保护可防止有人意外迁移目录。

在可以执行升级之前,您需要使用一个允许升级操作的策略语句将客户托管的 IAM 策略附加到执行迁移的用户。

下面是一个示例策略语句。

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "glue:ImportCatalogToGlue" ], "Resource": [ "*" ] } ] }

步骤 2-更新与 Athena 用户关联的客户管管/内联策略

如果您有与 Athena 用户关联的客户托管或内联 IAM 策略,则需要更新一个或多个策略以允许Amazon Glue需要使用。如果您使用 Athena 托管策略,则无需执行任何操作。下面的示例策略中列出了允许的 Amazon Glue 策略。有关完整策略声明,请参阅有关用户访问权限的 IAM 策略

{ "Effect":"Allow", "Action":[ "glue:CreateDatabase", "glue:DeleteDatabase", "glue:GetDatabase", "glue:GetDatabases", "glue:UpdateDatabase", "glue:CreateTable", "glue:DeleteTable", "glue:BatchDeleteTable", "glue:UpdateTable", "glue:GetTable", "glue:GetTables", "glue:BatchCreatePartition", "glue:CreatePartition", "glue:DeletePartition", "glue:BatchDeletePartition", "glue:UpdatePartition", "glue:GetPartition", "glue:GetPartitions", "glue:BatchGetPartition" ], "Resource":[ "*" ] }

步骤 3 — 在 Athena 控制台中选择升级

在您进行所需的 IAM 策略更新后,选择升级在 Athena 控制台中。Athena 将您的元数据移动到Amazon Glue Data Catalog。升级只需要几分钟。在您升级后,Athena 控制台会有一个链接,用以打开Amazon Glue从 Athena 内部的目录管理器。

使用控制台创建表时,您可以使用 Amazon Glue 爬网程序创建表。有关更多信息,请参阅 。使用Amazon Glue爬网程序