加入 Lake Formation 权限 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

加入 Lake Formation 权限

Amazon Lake Formation 使用 Amazon Glue Data Catalog (数据目录)以目录、数据库和表的形式存储 Amazon S3 数据湖和外部数据源(例如 Amazon Redshift)的元数据。数据目录中的元数据按三级数据层次结构进行组织,包括目录、数据库和表。它将来自各种来源的数据组织到称为目录的逻辑容器中。数据库是表的集合。数据目录还包含资源链接,这些链接是指向外部账户中共享数据库和表的链接,用于跨账户访问数据湖中的数据。每个 Amazon 账户在每个 Amazon 区域都有一个数据目录。

Lake Formation 提供了一种关系数据库管理系统 (RDBMS) 权限模型,用于授予或撤消对数据目录中包含底层数据的数据目录中的目录、数据库、表和列的访问权限。

在了解 Lake Formation 权限模型的详细信息之前,查看以下背景信息会很有帮助:

  • Lake Formation 管理的数据湖位于 Amazon Simple Storage Service (Amazon S3) 中的指定位置。数据目录还包含目录对象。每个目录都代表来自 Amazon Redshift 数据仓库、 Amazon DynamoDB 数据库和第三方数据源(例如 Snowflake、MySQL)和 30 多个外部数据源的数据,这些数据源通过联合连接器集成。

  • Lake Formation 维护一个数据目录,其中包含有关要导入数据湖的源数据(例如日志和关系数据库中的数据)以及有关 Amazon S3 中数据湖中的数据的元数据。数据目录还包含有关来自 Amazon S3 以外的外部数据源的数据的元数据。元数据按目录、数据库和表进行组织。元数据表包含架构、位置、分区以及有关它们所表示的数据的其他信息。元数据数据库是表的集合。

  • Lake Formation 数据目录与 Lake Formation 使用的数据目录相同 Amazon Glue。 你可以用 Amazon Glue 搜寻器来创建数据目录表,你可以使用 Amazon Glue 提取、转换和加载 (ETL) 作业以填充数据湖中的底层数据。

  • 数据目录中的目录、数据库和表被称为数据目录资源。数据目录中的表称为“元数据表”,以区别于数据来源中的表或 Amazon S3 中的表格数据。元数据表在 Amazon S3 或数据来源中指向的数据称为“基础数据”。

  • 委托人是指用户或角色、Amazon QuickSight 用户或群组、通过 SAML 提供商向 Lake Formation 进行身份验证的用户或群组,或者用于跨账户访问控制的 Amazon 账户 ID、组织 ID 或组织单位 ID。

  • Amazon Glue 抓取工具可以创建元数据表,但您也可以使用 Lake Formation 控制台、API 或 Amazon Command Line Interface (Amazon CLI) 手动创建元数据表。创建元数据表时,必须指定一个位置。创建数据库时,位置是可选的。表位置可以是 Amazon S3 位置或数据来源位置,例如 Amazon Relational Database Service (Amazon RDS) 数据库。数据库位置始终是 Amazon S3 位置。

  • 与 Lake Formation 集成的服务(如 Amazon Athena 和 Amazon Redshift)可以访问数据目录以获取元数据并检查运行查询的授权。有关集成服务的完整列表,请参阅 Amazon 与 Lake Formation 的服务集成