配置元数据表 - Amazon Simple Storage Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

配置元数据表

Amazon S3 元数据通过自动捕获通用存储桶中对象的元数据,并将其存储在您可以查询的只读、完全托管式 Apache Iceberg 表中,从而加快数据发现速度。这些只读表称为元数据表。在通用存储桶中添加、更新和移除对象时,S3 元数据会自动刷新相应的元数据表,以反映最新的更改。

借助 S3 元数据,您可以轻松查找、存储和查询 S3 对象的元数据,这样您就可以快速准备数据,以用于业务分析、人工智能和机器学习(AI/ML)模型训练等。

要生成对象元数据并将其存储在 S3 托管式元数据表中,您需要为通用存储桶创建元数据表配置。只要存储桶上的配置处于活动状态,Amazon S3 就会持续更新元数据表以反映对数据的最新更改。此外,Amazon S3 会持续优化您的元数据表,以有助于降低存储成本并提高分析查询性能。

要创建元数据表配置,确保您拥有创建和管理元数据表所必需的 Amazon Identity and Access Management(IAM)权限。您还必须创建或指定用于存储元数据表的 S3 表存储桶。此表存储桶必须与通用存储桶位于相同的 Amazon Web Services 区域和 Amazon Web Services 账户中。

要监控对元数据表配置的更新,可以使用 Amazon CloudTrail。有关更多信息,请参阅 CloudTrail 日志记录跟踪的 Amazon S3 存储桶级操作