启用 Amazon S3 表类数据存储服务集成 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

启用 Amazon S3 表类数据存储服务集成

您可以使用 Amazon S3 控制台创建 Amazon S3 表类数据存储服务存储桶,并将其与 Amazon 分析服务集成。有关更多信息,请参阅将 Amazon S3 表类数据存储服务与 Amazon 分析服务配合使用

在 Amazon Lake Formation 中,您可以使用 Lake Formation 控制台或使用 Amazon CLI 启用 Amazon S3 表类数据存储服务与 Amazon Glue Data Catalog 和 Amazon Lake Formation 的集成。

  1. 通过 https://console.aws.amazon.com/lakeformation/ 打开 Lake Formation 控制台。

  2. 在导航窗格的 Data Catalog 下,选择目录

  3. 目录页面上选择启用 S3 表集成

    目录页面上的启用 S3 表集成选项。
  4. 选择一个具有所需权限的 IAM 角色,供 Lake Formation 代入,以便向分析查询引擎提供凭证。有关该角色访问数据所需的权限,请参阅先决条件部分的step3-permissions

    使用 IAM 角色启用 S3 集成屏幕。
  5. 选择支持外部引擎以完全表访问权限访问 Amazon S3 位置的数据选项。当您为第三方引擎启用完全表访问权限时,Lake Formation 将直接向第三方引擎返回凭证,而无需执行 IAM 会话标签验证。这意味着您无法对要访问的表应用 Lake Formation 精细访问控制。

  6. 请选择启用。S3 表的新目录已添加到目录列表中。启用 S3 表目录集成后,该服务会向 Lake Formation 注册 S3 表存储桶的数据位置。

  7. 选择目录以查看目录对象并向其他主体授予权限。

    S3 表目录

    要创建多级目录,请参阅《Amazon Simple Storage Service 用户指南》中的创建表存储桶部分。

  1. 将 S3 表目录注册为 Lake Formation 数据位置。

    aws lakeformation register-resource \ --resource-arn 'arn:aws:s3tables:us-east-1:123456789012:bucket/*' \ --role-arn 'arn:aws:iam::123456789012:role/LakeFormationDataAccessRole' \ --with-federation --with-privileged-access
  2. 创建目录。

    aws glue create-catalog --cli-input-json file://input.json '{ "Name": "s3tablescatalog", "CatalogInput" : { "FederatedCatalog": { "Identifier": "arn:aws:s3tables:us-east-1:123456789012:bucket/*", "ConnectionName": "aws:s3tables" }, "CreateDatabaseDefaultPermissions": [], "CreateTableDefaultPermissions": [] } }'