第 3 步:创建 Lake Formation 数据 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第 3 步:创建 Lake Formation 数据

在此步骤中,您将创建两个数据库并将 LF-tag 附加到数据库和特定列,以便测试。

为数据库级别的访问创建数据库和表

  1. 首先,创建数据库tag_database,表格source_data,然后附上适当的 LF 标签。

    1. 在 Lake Formation 控制台上(https://console.aws.amazon.com/lakeformation/),选择数据库.

    2. 选择 Create database(创建数据库)。

    3. 对于 Name (名称),请输入 tag_database

    4. 适用于位置中 Amazon S3 入由Amazon CloudFormation模板(s3://lf-tagbased-demo-Account-ID/tag_database/).

    5. Select仅对此数据库中的新表使用 IAM 访问控制.

    6. 选择 Create database(创建数据库)。

  2. 接下来,在中创建一个新表tag_database.

    1. 在存储库的数据库页面上,选择数据库tag_database.

    2. 选择查看表然后单击创建表.

    3. 对于 Name (名称),请输入 source_data

    4. 对于 Database (数据库),选择 tag_database 数据库。

    5. 适用于数据位于,选择我的账户中指定的路径.

    6. 对于包含路径,输入路径tag_database由Amazon CloudFormation模板(s3://lf-tagbased-demoAccount-ID/tag_database/).

    7. 适用于数据格式,选择CSV.

    8. UNDER上传架构中,输入以下列结构 JSON 数组以创建架构:

      [ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
    9. 请选择 Upload(上传)。上传模式后,表架应类似于以下屏幕截图:

    10. 选择 Submit(提交)

  3. 接下来,在数据库级别附加 LF-Tags。

    1. 在存储库的数据库页面上,查找并选择tag_database.

    2. 在存储库的操作菜单中,选择编辑 LF 标签.

    3. 选择分配新的 LF-Tag.

    4. 适用于分配的密钥选择Confidential LF-tag您在之前创建的。

    5. 适用于,选择True.

    6. 选择 Save(保存)。

    这样就完成了对 tag_data 数据库的 LF-tag 分配。

创建数据库和表以便列级访问权限

重复以下步骤以创建数据库:col_tag_database和表source_data_col_lvl,然后在列级别附加 LF 标签。

  1. 在存储库的数据库页面上,选择创建数据库.

  2. 对于 Name (名称),请输入 col_tag_database

  3. 适用于位置中 Amazon S3 入由Amazon CloudFormation模板(s3://lf-tagbased-demo-Account-ID/col_tag_database/).

  4. Select仅对此数据库中的新表使用 IAM 访问控制.

  5. 选择 Create database(创建数据库)。

  6. 在存储库的数据库页面上,选择新数据库(col_tag_database).

  7. 选择查看表然后舔创建表.

  8. 对于 Name (名称),请输入 source_data_col_lvl

  9. 适用于数据库,选择新数据库(col_tag_database).

  10. 适用于数据位于,选择我的账户中指定的路径.

  11. 输入的 Amazon S3 路径col_tag_database (s3://lf-tagbased-demo-Account-ID/col_tag_database/).

  12. 适用于数据格式,选择CSV.

  13. UNDERUpload schema中,输入以下架构 JSON:

    [ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
  14. 选择 Upload。上传模式后,表架应类似于以下屏幕截图。

  15. 选择提交以完成表的创建。

  16. 现在,关联Sensitive=True对列进行 lf-tagvendoridfare_amount.

    1. 在存储库的页面上,选择您创建的表(source_data_col_lvl).

    2. 在存储库的操作菜单中,选择架构.

    3. 选择列vendorid然后选择编辑 LF 标签.

    4. 适用于分配的密钥,选择S敏感.

    5. 适用于,选择True.

    6. 选择 Save(保存)。

  17. 接下来,关联Confidential=Falself-tag 到col_tag_database. 这是必需的lf-data-analyst能够描述数据库col_tag_database从 Athena 登录时。

    1. 在存储库的数据库页面上,查找并选择col_tag_database.

    2. 在存储库的操作菜单中,选择编辑 LF 标签.

    3. 选择分配新的 LF-Tag.

    4. 适用于分配的密钥选择Confidential您之前创建的 LF-Tag。

    5. 适用于,选择False.

    6. 选择 Save(保存)。