使用 Amazon 分析服务查询元数据表
可以使用诸如 Amazon Athena、Amazon Redshift 和 Amazon EMR 等 Amazon 分析服务查询 S3 托管式元数据表。
在可以运行查询之前,必须先将您的 Amazon Web Services 账户和区域中的 S3 表存储桶与 Amazon 分析服务集成。
使用 Amazon Athena 查询元数据表
集成 S3 表存储桶与 Amazon 分析服务后,即可开始在 Athena 中查询元数据表。在查询中,将目录指定为 s3tablescatalog
,并将数据库指定为 aws_s3_metadata
(这是元数据表的命名空间)。有关更多信息,请参阅使用 Athena 查询 Amazon S3 表类数据存储服务。
使用 Amazon Redshift 查询元数据表
集成 S3 表存储桶与 Amazon 分析服务后,您可以创建资源链接来指向元数据表命名空间 (aws_s3_metadata
)。完成后,您就可以开始在 Amazon Redshift 控制台中查询元数据表了。有关更多信息,请参阅使用 Amazon Redshift 访问 Amazon S3 表类数据存储服务。
使用 Amazon EMR 查询元数据表
要使用 Amazon EMR 查询元数据表,您需要创建为 Apache Iceberg 配置的 Amazon EMR 集群,然后使用 Apache Spark 连接到元数据表。您可以通过将 S3 表存储桶与 Amazon 分析服务集成,或者使用适用于 Iceberg 的开源 Amazon S3 表类数据存储服务目录客户端目录,来对此进行设置。
有关更多信息,请参阅使用 Amazon EMR 访问 Amazon S3 表类数据存储服务。