什么是 AWS Lake Formation? - AWS Lake Formation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

什么是 AWS Lake Formation?

欢迎阅读 AWS Lake Formation 开发人员指南。

AWS Lake Formation 是一项完全托管的服务,可让您更轻松地构建、保护和管理数据湖。 Lake Formation 简化和自动化许多创建数据湖通常需要的复杂的手动步骤。这些步骤包括收集、清理、移动和编录数据,以及安全地使该数据可用于分析和机器学习。你指出 Lake Formation 数据源,以及 Lake Formation 爬过这些来源并将数据移动到您的新 Amazon Simple Storage Service (人Amazon S3)数据湖。

Lake Formation 提供自己的权限模型,用于增强 AWS Identity and Access Management (人IAM)权限模型。此集中定义的权限模型可通过简单的授予/撤销机制,实现对存储在数据湖中的数据的细粒度访问。

Lake Formation 权限在表和列级别在AWS分析和机器学习服务的整个组合中执行。

AWS 服务与 Lake Formation 集成

以下AWS服务集成了 AWS Lake Formation 和荣誉 Lake Formation 权限。

AWS 服务 如何整合
AWS Glue AWS Glue 和 Lake Formation 分享相同的 Data Catalog. 对于控制台操作(例如查看表列表)和所有API操作, AWS Glue 用户只能访问其拥有的数据库和表 Lake Formation 权限。 AWS Glue 不支持 Lake Formation 列权限。
Amazon Athena 何时 Amazon Athena 用户选择 AWS Glue 查询编辑器中的目录,则只能查询其拥有的数据库、表格和列 Lake Formation 上的权限。不支持使用清单的查询。

除了 Athena 至 AWS Identity and Access Management (人IAM), Lake Formation 支撑 Athena 通过JDBC或ODBC驱动程序连接并通过SAML进行身份验证的用户。支持的SAML提供程序包括Okta和MicrosoftActiveDirectoryFederationService(ADFS)。有关更多信息,请参阅 使用LakeFormation和AthenaJDBC以及ODBCDrivers实现对Athena的联合访问AmazonAthena用户指南.

Amazon Redshift Spectrum 何时 Amazon Redshift 用户在数据库中创建外部框架 AWS Glue ,则只能查询其所在框架中的表和列 Lake Formation 权限。

不支持使用清单的查询。

Amazon QuickSight 企业版 当 Amazon QuickSight EnterpriseEdition用户查询 Amazon S3 注册地点 Lake Formation,用户必须具有 Lake Formation SELECT 对数据的权限。
Amazon EMR Lake Formation 使用ApacheZeppelin或EMR笔记本提交ApacheSpark应用程序时,将强制使用权限。

Lake Formation 也与 AWS Key Management Service (人AWS KMS)让您更轻松地设置这些集成服务,以加密和解密数据 Amazon Simple Storage Service (人Amazon S3)位置。

开始使用 Lake Formation

我们建议您从以下部分开始: