第8步: 使用蓝图创建工作流程 - AWS Lake Formation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

第8步: 使用蓝图创建工作流程

的 AWS Lake Formation 工作流生成 AWS Glue 工作、爬网器和触发器,用于发现数据并将其载入您的数据湖。您根据预定义的 Lake Formation 蓝图。

  1. 在 Lake Formation 控制台,在导航窗格中,选择 蓝图,然后选择 使用蓝图.

  2. 使用蓝图 页面,下方 蓝图类型,选择 数据库快照.

  3. 低于 导入来源,对于 数据库连接,选择您刚刚创建的连接, datalake-tutorial,或为您的数据源选择现有连接。

  4. 对于 源数据路径,在表单中,输入从中摄取数据的路径 <database>/<schema>/<table>.

    您可以用百分比(%)通配符替换框架或表。对于支持框架的数据库,请输入 <database>/<schema>/%与中的所有表匹配 <schema> 在内 <database>。Oracle数据库和 MySQL 在路径中不支持框架;相反,请输入 <database>/%。对于Oracle数据库,<database> 是系统标识符(SID)。

    例如,如果Oracle数据库 orcl 作为SID,输入 orcl/% 以匹配用户在JDCB连接中指定的有权访问的所有表。

    重要

    此字段区分大小写。

  5. 低于 导入目标,请指定以下参数:

    目标数据库 lakeformation_tutorial
    目标存储位置 s3://<yourName>-datalake-tutorial
    数据格式 (选择拼音或CSV)
  6. 对于导入频率,请选择 按需运行.

  7. 低于 导入选项,请指定以下参数:

    工作流名称 lakeformationjdbctest
    IAM 角色 LakeFormationWorkflowRole
    表前缀 jdbctest
    注意

    必须小写。

  8. 选择 创建,并等待控制台报告工作流已成功创建。

    提示

    您收到以下错误消息吗?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    如果是,请检查您是否更换了 <account-id> 在有效AWS帐号的数据湖管理员用户的内联策略中。