在 Athena for Spark 中配置跨账户 Amazon Glue 存取。

本主题介绍如何将消费者账户 666666666666 和所有者账户 999999999999 配置为跨账户 Amazon Glue 访问。配置账户后，消费者账户可以从 Athena for Spark 对所有者的 Amazon Glue 数据库和表运行查询。

步骤 1：在 Amazon Glue 中，提供对使用者角色的访问权限

在 Amazon Glue 中，所有者创建了一个策略，为消费者的角色提供对所有者 Amazon Glue 数据目录的访问权限。

在数据目录设置页面的权限部分，添加如下所示的策略。本策略为使用者账户 666666666666 提供了访问拥有者账户 999999999999 中数据目录的角色。

在消费者账户中，创建允许访问所有者 Amazon Glue Data Catalog、数据库和表的策略，并将该策略附加到角色。以下示例使用消费者账户 666666666666。

在策略编辑器中，输入如下所示的 JSON 语句，该语句允许对所有者账户的数据目录进行 Amazon Glue 操作。

接下来，您可以在消费者账户中使用 IAM 控制台将您刚刚创建的策略附加到消费者账户将用于访问所有者数据目录的 IAM 一个或多个角色。

在 Athena Spark 中，在请求者账户中，使用指定的角色创建会话，通过创建笔记本或编辑当前会话来测试访问权限。配置会话属性时，请指定以下选项之一：

编辑会话属性时，添加以下内容：


{ 
    "spark.hadoop.aws.glue.catalog.separator": "/" 
}

在单元格中运行查询时，请使用与以下示例类似的语法。请注意，在 FROM 子句中，数据库名称前必须有目录 ID 和分隔符。


df = spark.sql('SELECT requestip, uri, method, status FROM `999999999999/mydatabase`.cloudfront_logs LIMIT 5') 
df.show()

编辑会话属性时，输入以下属性。将 999999999999 替换为所有者账户 ID。


{ 
    "spark.hadoop.hive.metastore.glue.catalogid": "999999999999" 
}

在单元格中运行查询时，请使用与以下类似的语法。请注意，在 FROM 子句中，数据库名称前不能有目录 ID 和分隔符。


df = spark.sql('SELECT * FROM mydatabase.cloudfront_logs LIMIT 10') 
df.show()

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

启用 Spark 加密

服务配额