开始前的准备工作 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

开始前的准备工作

在启动 Amazon EMR 集群和 Amazon Lake Formation 之前,请满足以下先决条件:

  1. 在您的身份提供商和 Amazon 之间建立信任关系以启用基于 SAML 2.0 的联合,并为 Lake Formation 创建 IAM 角色。有关说明,请参阅配置 IdP 和 Lake Formation 之间的信任关系

  2. 创建新的 Amazon EC2 实例配置文件。有关说明,请参阅创建自定义 Amazon EC2 实例配置文件

  3. 配置 Amazon EMR 安全功能。有关说明,请参阅配置 EMR 安全性

您还应该完成以下在《Amazon Lake Formation开发人员指南》中包含的 Amazon Lake Formation 任务

  1. 通过选择启动,允许对 Amazon EMR 上的数据湖进行数据筛选。您可以在使用 Lake Formation 启动 Amazon EMR 集群之前或之后选择启用,但您必须明确允许数据过滤,然后 Amazon EMR 才能访问使用 Lake Formation 注册的 Amazon S3 位置中的数据。有关更多信息和说明,请参阅《Lake Formation 开发人员指南》中的允许在 Amazon EMR 上筛选数据

  2. 为 Lake Formation 创建用户定义的服务角色以注册 Amazon EMR 将访问的数据位置。有关说明,请参阅用于注册位置的角色的要求

    警告

    注册数据位置时,您必须使用用户定义的角色,而不是 Lake Formation 服务相关角色。当您与 EMR 集成时,Lake Formation 不支持使用其服务相关角色。

  3. 通过 Amazon Lake Formation 控制台中的 Lake Formation 策略设置和控制用户对资源的访问。有关更多信息,请参阅 Lake Formation 权限