本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 8:使用蓝图创建工作流程
该Amazon Lake Formation工作流程会生成Amazon Glue任务、爬网程序和触发器,用于发现数据并将其摄入您的数据湖。您可以根据其中一个预定义的 Lake Formation 蓝图创建工作流程。
-
在 Lake Formation 控制台的导航窗格中,选择蓝图,然后选择使用蓝图。
-
在使用蓝图页面的蓝图类型下,选择数据库快照。
-
在 “导入源” 下的 “数据库连接” 下,选择刚才创建的连接
datalake-tutorial
,或者为数据源选择现有连接。 -
对于源数据路径,在表单中输入从中提取数据的路径
。<database>
/<schema>
/<table>
您可以用百分比 (%) 通配符代替架构或表。对于支持架构的数据库,输入
<database>/
<schema>/% 以匹配其
<schema>中的所有表
<database>。Oracle 数据库和 MySQL 不支持路径中的架构;而是输入
<database>/%。对于 Oracle 数据库,
<database>是系统标识符 (SID)。
例如,如果 Oracle 数据库以 SID
orcl
作为其 SID,则输入orcl/%
以匹配 JDCB 连接中指定的用户有权访问的所有表。重要
此字段区分大小写。
-
在 “导入目标” 下,指定以下参数:
目标数据库 lakeformation_tutorial
目标存储位置 s3://
<yourName>
-datalake-tutorialData format(数据格式) (选择 Parquet 或 CSV) -
对于导入频率,选择 “按需运行”。
-
在 “导入选项” 下,指定以下参数:
工作流程名称 lakeformationjdbctest
IAM 角色 LakeFormationWorkflowRole
表前缀 jdbctest
注意
必须是小写字母。
-
选择 C reate,然后等待控制台报告工作流程已成功创建。
提示
您收到以下错误消息吗?
User: arn:aws:iam::
<account-id>
:user/<datalake_administrator_user>
is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>
:role/LakeFormationWorkflowRole...如果是,请检查您是否<account-id>将数据湖管理员用户的内联策略替换
为有效的Amazon帐号。