第 2 步:设置受管理的表 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 2 步:设置受管理的表

现在,您可以在 Lake Formation 中创建和配置第一个受管理的表。

创建受管理的表

  1. 登录到Lake Formation控制台https://console.amazonaws.cn/lakeformation/作为DatalakeAdmin1用户。

  2. 选择

  3. 选择 Create Table(创建表)。

  4. 对于姓名,请输入amazon_reviews_governed.

  5. 对于数据库,请输入lakeformation_tutorial_amazon_reviews.

  6. Select启用受管控的数据访问和管理.

  7. 适用于数据位于,选择我的账户中指定的路径.

  8. 输入路径s3://your-datalake-bucket-name/parquet/哪里你的数据湖存储桶名称您在Amazon CloudFormation模板。

  9. 适用于Classification,选择实木复合地板.

  10. 选择上传架构.

  11. 在文本框中输入以下 Json 数组。

    [ { "Name": "marketplace", "Type": "string" }, { "Name": "customer_id", "Type": "string" }, { "Name": "review_id", "Type": "string" }, { "Name": "product_id", "Type": "string" }, { "Name": "product_parent", "Type": "string" }, { "Name": "product_title", "Type": "string" }, { "Name": "star_rating", "Type": "int" }, { "Name": "helpful_votes", "Type": "int" }, { "Name": "total_votes", "Type": "int" }, { "Name": "vine", "Type": "string" }, { "Name": "verified_purchase", "Type": "string" }, { "Name": "review_headline", "Type": "string" }, { "Name": "review_body", "Type": "string" }, { "Name": "review_date", "Type": "bigint" }, { "Name": "year", "Type": "int" } ]
  12. 请选择 Upload(上传)。

  13. 选择 Add column(添加列)。

  14. 对于列名称,输入product_category.

  15. 对于数据类型,选择字符串.

  16. Select分区键.

  17. 选择 Add(添加)。

  18. 选择 Submit(提交)

现在,您可以看到新的受管理表已创建。

选择表名时,您可以看到受管理表的详细信息,还可以看到监管:Enabled (已启用)在这个观点中。这意味着这张桌子是一张 Lake Formation 管理的表格。不受管辖的表应显示为监管:Disabled.

默认情况下,对受管理的表启用了自动压缩。使用禁用自动压缩Amazon Amazon CLI和 SDK,运行以下命令:

$ aws lakeformation update-table-storage-optimizer --database-name lakeformation_tutorial_amazon_reviews --table-name amazon_reviews_governed --storage-optimizer-config '{"compaction": {"is_enabled":"false"}}'