使用 Amazon 分析服务查询元数据表 - Amazon Simple Storage Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 Amazon 分析服务查询元数据表

可以使用诸如 Amazon Athena、Amazon Redshift 和 Amazon EMR 等 Amazon 分析服务查询 S3 托管式元数据表。

在可以运行查询之前,必须先将您的 Amazon Web Services 账户和区域中的 S3 表存储桶与 Amazon 分析服务集成

使用 Amazon Athena 查询元数据表

集成 S3 表存储桶与 Amazon 分析服务后,即可开始在 Athena 中查询元数据表。在查询中,将目录指定为 s3tablescatalog,并将数据库指定为 aws_s3_metadata(这是元数据表的命名空间)。有关更多信息,请参阅使用 Athena 查询 Amazon S3 表类数据存储服务

使用 Amazon Redshift 查询元数据表

集成 S3 表存储桶与 Amazon 分析服务后,您可以创建资源链接来指向元数据表命名空间 (aws_s3_metadata)。完成后,您就可以开始在 Amazon Redshift 控制台中查询元数据表了。有关更多信息,请参阅使用 Amazon Redshift 访问 Amazon S3 表类数据存储服务

使用 Amazon EMR 查询元数据表

要使用 Amazon EMR 查询元数据表,您需要创建为 Apache Iceberg 配置的 Amazon EMR 集群,然后使用 Apache Spark 连接到元数据表。您可以通过将 S3 表存储桶与 Amazon 分析服务集成,或者使用适用于 Iceberg 的开源 Amazon S3 表类数据存储服务目录客户端目录,来对此进行设置。

有关更多信息,请参阅使用 Amazon EMR 访问 Amazon S3 表类数据存储服务