步骤 8:使用蓝图创建工作流程 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 8:使用蓝图创建工作流程

该Amazon Lake Formation工作流程会生成Amazon Glue任务、爬网程序和触发器,用于发现数据并将其摄入您的数据湖。您可以根据其中一个预定义的 Lake Formation 蓝图创建工作流程。

  1. 在 Lake Formation 控制台的导航窗格中,选择蓝图,然后选择使用蓝图

  2. 使用蓝图页面的蓝图类型下,选择数据库快照

  3. 在 “导入源” 下的 “数据库连接” 下,选择刚才创建的连接datalake-tutorial,或者为数据源选择现有连接。

  4. 对于源数据路径,在表单中输入从中提取数据的路径<database>/<schema>/<table>

    您可以用百分比 (%) 通配符代替架构或表。对于支持架构的数据库,输入<database>/<schema>/% 以匹配其<schema>中的所有表<database>。Oracle 数据库和 MySQL 不支持路径中的架构;而是输入 <database>/%。对于 Oracle 数据库,<database>是系统标识符 (SID)。

    例如,如果 Oracle 数据库以 SIDorcl 作为其 SID,则输入orcl/%以匹配 JDCB 连接中指定的用户有权访问的所有表。

    重要

    此字段区分大小写。

  5. 在 “导入目标” 下,指定以下参数:

    目标数据库 lakeformation_tutorial
    目标存储位置 s3://<yourName>-datalake-tutorial
    Data format(数据格式) (选择 Parquet 或 CSV)
  6. 对于导入频率,选择 “按需运行”。

  7. 在 “导入选项” 下,指定以下参数:

    工作流程名称 lakeformationjdbctest
    IAM 角色 LakeFormationWorkflowRole
    表前缀 jdbctest
    注意

    必须是小写字母。

  8. 选择 C reate,然后等待控制台报告工作流程已成功创建。

    提示

    您收到以下错误消息吗?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    如果是,请检查您是否<account-id>将数据湖管理员用户的内联策略替换为有效的Amazon帐号。