Amazon EMR
管理指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

将 Amazon EMR 与 Lake Formation 集成的概念性介绍

通过将 Amazon EMR 与 AWS Lake Formation 集成,您可以通过公司凭证启用基于 SAML 的身份验证,并且基于在 AWS Lake Formation 中定义的策略,实施精细的列级别访问控制。

要将 Amazon EMR 与 Lake Formation 集成,您的组织必须满足下列要求:

  • 使用现有基于 SAML 的身份提供程序管理您的公司身份,例如 Active Directory 联合身份验证服务 (AD FS)。有关更多信息,请参阅 SAML 支持的第三方提供程序

  • 使用 AWS Glue Data Catalog 作为元数据存储。

  • 使用 EMR 笔记本或 Apache Zeppelin 访问由 AWS Glue 和 Lake Formation 管理的数据。

  • 在 Lake Formation 中定义和管理权限以访问 AWS Glue Data Catalog 中的数据库、表和列。有关更多信息,请参阅 AWS Lake Formation

在启动与 Lake Formation 集成的集群之前,您需要通过配置身份提供程序 (IdP) 和 AWS Access and Identity Management (IAM) 角色,启用基于 SAML 2.0 的联合身份。您还需要为您的 Amazon EMR 集群设置合适的安全控制。有关更多信息,请参阅 开始前的准备工作启动具有 Lake Formation 的 Amazon EMR 集群