在中创建 Amazon S3 表目录 Amazon Glue Data Catalog - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中创建 Amazon S3 表目录 Amazon Glue Data Catalog

Amazon S3 表提供专门针对分析工作负载进行优化的 S3 存储,在提高查询性能的同时降低成本。S3 表类数据存储服务中的数据存储在新的存储桶类型中:表存储桶,它将表存储为子资源。S3 表内置支持 Apache Iceberg 标准,允许您使用 Apache Spark 等常用查询引擎轻松查询 Amazon S3 表存储桶中的表格数据。

您可以将 Amazon S3 表存储桶和表与 Amazon Glue Data Catalog (数据目录)集成,并通过 Lake Formation 控制台或使用服务 APIs将该目录注册为 Lake Formation 数据位置。

有关更多信息,请参阅《亚马逊简单存储服务用户指南》中的将 Amazon S3 表与 Amazon 分析服务配合使用

数据目录和 Lake Formation 集成的工作原理

当您将 S3 表目录与数据目录和 Lake Formation 集成时,该 Amazon Glue 服务会在您的账户的默认数据目录s3tablescatalog中创建一个名为您的特定于您的的联合目录 Amazon Web Services 区域。该集成按以下方式映射您的账户和联合目录 Amazon Web Services 区域 下的所有 Amazon S3 表存储桶资源:

  • Amazon S3 表存储桶在数据目录中变为多级目录。

  • 关联的 Amazon S3 命名空间在数据目录中注册为数据库。

  • 表存储桶中的 Amazon S3 表会变成数据目录中的表。

S3 表和之间对象的映射 Amazon Glue Data Catalog。

与 Lake Formation 集成后,您可以在表存储桶目录中创建 Apache Iceberg 表,并通过 Amazon Athena Amazon EMR 等集成 Amazon 分析引擎以及第三方分析引擎访问这些表。