本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
第 3 步:创建 Lake Formation 数据
在此步骤中,您将创建两个数据库并将 LF-tag 附加到数据库和特定列,以便测试。
为数据库级别的访问创建数据库和表
-
首先,创建数据库
tag_database
,表格source_data
,然后附上适当的 LF 标签。在 Lake Formation 控制台上(https://console.aws.amazon.com/lakeformation/
),选择数据库. 选择 Create database(创建数据库)。
对于 Name (名称),请输入
tag_database
。适用于位置中 Amazon S3 入由Amazon CloudFormation模板
(s3://lf-tagbased-demo-
.Account-ID
/tag_database/)Select仅对此数据库中的新表使用 IAM 访问控制.
选择 Create database(创建数据库)。
-
接下来,在中创建一个新表
tag_database
.在存储库的数据库页面上,选择数据库
tag_database
.选择查看表然后单击创建表.
对于 Name (名称),请输入
source_data
。对于 Database (数据库),选择
tag_database
数据库。适用于数据位于,选择我的账户中指定的路径.
对于包含路径,输入路径
tag_database
由Amazon CloudFormation模板(s3://lf-tagbased-demo
.Account-ID
/tag_database/)适用于数据格式,选择CSV.
UNDER上传架构中,输入以下列结构 JSON 数组以创建架构:
[ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
请选择 Upload(上传)。上传模式后,表架应类似于以下屏幕截图:
选择 Submit(提交)。
-
接下来,在数据库级别附加 LF-Tags。
在存储库的数据库页面上,查找并选择
tag_database
.在存储库的操作菜单中,选择编辑 LF 标签.
选择分配新的 LF-Tag.
适用于分配的密钥选择
Confidential
LF-tag
您在之前创建的。适用于值,选择
True
.选择 Save(保存)。
这样就完成了对 tag_data 数据库的 LF-tag 分配。
创建数据库和表以便列级访问权限
重复以下步骤以创建数据库:col_tag_database
和表source_data_col_lvl
,然后在列级别附加 LF 标签。
在存储库的数据库页面上,选择创建数据库.
-
对于 Name (名称),请输入
col_tag_database
。 -
适用于位置中 Amazon S3 入由Amazon CloudFormation模板
(s3://lf-tagbased-demo-
.Account-ID
/col_tag_database/) -
Select仅对此数据库中的新表使用 IAM 访问控制.
-
选择 Create database(创建数据库)。
在存储库的数据库页面上,选择新数据库
(col_tag_database)
.选择查看表然后舔创建表.
对于 Name (名称),请输入
source_data_col_lvl
。适用于数据库,选择新数据库
(col_tag_database)
.适用于数据位于,选择我的账户中指定的路径.
输入的 Amazon S3 路径
col_tag_database
(s3://lf-tagbased-demo-
.Account-ID
/col_tag_database/)适用于数据格式,选择
CSV
.UNDER
Upload schema
中,输入以下架构 JSON:[ { "Name": "vendorid", "Type": "string" }, { "Name": "lpep_pickup_datetime", "Type": "string" }, { "Name": "lpep_dropoff_datetime", "Type": "string" }, { "Name": "store_and_fwd_flag", "Type": "string" }, { "Name": "ratecodeid", "Type": "string" }, { "Name": "pulocationid", "Type": "string" }, { "Name": "dolocationid", "Type": "string" }, { "Name": "passenger_count", "Type": "string" }, { "Name": "trip_distance", "Type": "string" }, { "Name": "fare_amount", "Type": "string" }, { "Name": "extra", "Type": "string" }, { "Name": "mta_tax", "Type": "string" }, { "Name": "tip_amount", "Type": "string" }, { "Name": "tolls_amount", "Type": "string" }, { "Name": "ehail_fee", "Type": "string" }, { "Name": "improvement_surcharge", "Type": "string" }, { "Name": "total_amount", "Type": "string" }, { "Name": "payment_type", "Type": "string" } ]
选择
Upload
。上传模式后,表架应类似于以下屏幕截图。选择提交以完成表的创建。
-
现在,关联
Sensitive=True
对列进行 lf-tagvendorid
和fare_amount
.在存储库的表页面上,选择您创建的表
(source_data_col_lvl)
.在存储库的操作菜单中,选择架构.
选择列
vendorid
然后选择编辑 LF 标签.适用于分配的密钥,选择S敏感.
适用于值,选择True.
选择 Save(保存)。
-
接下来,关联
Confidential=False
lf-tag 到col_tag_database
. 这是必需的lf-data-analyst
能够描述数据库col_tag_database
从 Athena 登录时。在存储库的数据库页面上,查找并选择
col_tag_database
.在存储库的操作菜单中,选择编辑 LF 标签.
选择分配新的 LF-Tag.
适用于分配的密钥选择
Confidential
您之前创建的 LF-Tag。适用于值,选择
False
.选择 Save(保存)。