配置元数据表
Amazon S3 元数据通过自动捕获通用存储桶中对象的元数据,并将其存储在您可以查询的只读、完全托管式 Apache Iceberg 表中,从而加快数据发现速度。这些只读表称为元数据表。在通用存储桶中添加、更新和移除对象时,S3 元数据会自动刷新相应的元数据表,以反映最新的更改。
借助 S3 元数据,您可以轻松查找、存储和查询 S3 对象的元数据,这样您就可以快速准备数据,以用于业务分析、人工智能和机器学习(AI/ML)模型训练等。
要生成对象元数据并将其存储在 Amazon 托管式元数据表中,需要为通用存储桶创建元数据表配置。Amazon S3 设计为持续更新元数据表,以反映对数据的最新更改,只要配置在存储桶上处于活动状态即可。此外,Amazon S3 会持续优化您的元数据表,以有助于降低存储成本并提高分析查询性能。
要创建元数据表配置,确保您拥有创建和管理元数据表所必需的 Amazon Identity and Access Management(IAM)权限。
要监控对元数据表配置的更新,可以使用 Amazon CloudTrail。有关更多信息,请参阅 CloudTrail 日志记录跟踪的 Amazon S3 存储桶级操作。