元数据和数据的安全和访问控制 Lake Formation - AWS Lake Formation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

元数据和数据的安全和访问控制 Lake Formation

AWS Lake Formation 提供基于简单授予/撤销机制的权限模型。 Lake Formation 权限与组合 AWS Identity and Access Management (人IAM)控制对存储在数据湖中的数据的访问权限以及描述该数据的元数据的权限。

在了解 Lake Formation 权限模型,查看以下背景信息将很有帮助:

  • 数据湖管理员 Lake Formation 位于 Amazon Simple Storage Service (人Amazon S3)。

  • Lake Formation 维持一个 Data Catalog 包含有关要导入数据湖的源数据的元数据,例如日志和关系数据库中的数据,以及有关 Amazon S3. 元数据被组织为数据库和表。元数据表包含框架,位置,分区以及其他有关它们所代表的数据的信息。元数据数据库是表的集合。

  • 的 Lake Formation Data Catalog 一样 Data Catalog 使用人 AWS Glue. 您可以使用 AWS Glue 爬网器 Data Catalog 表格,您可以使用 AWS Glue 提取、转换和加载(ETL)作业以填充数据湖中的基础数据。

  • 中的数据库和表格 Data Catalog 被称为 Data Catalog 资源. 中的表格 Data Catalog 被称为 元数据表 将其与数据源中的表格或表格数据区分开来 Amazon S3. 元数据表所指向的数据 Amazon S3 或数据源中称为 基础数据.

  • AWS Glue 爬网器创建元数据表,但您也可以使用 Lake Formation 控制台、API或 AWS Command Line Interface (人AWS CLI)。创建元数据表时,您必须指定位置。创建数据库时,位置是可选的。桌面位置可以 Amazon S3 位置或数据源位置,例如 Amazon Relational Database Service (人Amazon RDS)数据库。数据库位置始终是 Amazon S3 位置。

  • 与集成的服务 Lake Formation,例如 Amazon Athena 和 Amazon Redshift,可访问 Data Catalog 获取元数据并检查运行查询的授权。有关集成服务的完整列表,请参阅 AWS 服务与 Lake Formation 集成.