步骤 8:使用蓝图创建工作流 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 8:使用蓝图创建工作流

这些区域有:Amazon Lake Formation工作流程将生成Amazon Glue发现数据并将数据摄取到您的数据湖中的作业、爬网程序和触发器。您可以根据预定义的 Lake Formation 蓝图之一创建工作流程。

  1. 在 Lake Storage 控制台上的导航窗格中,选择 Lake Storage蓝图选择,然后选择使用蓝图.

  2. 在存储库的使用蓝图页面,下蓝图类型,选择数据库快照.

  3. 在下导入源,对于数据库连接,选择您刚刚创建的连接,datalake-tutorial,或者为数据源选择现有连接。

  4. 适用于源数据路径中,在窗体中输入从中提取数据的路径<database>/<schema>/<table>.

    您可以用百分比 (%) 通配符替换架构或表。对于支持模式的数据库,请输入<database>/<schema>/% 以匹配中的所有表<schema>之内<database>. Oracle Database 和 MySQL 不支持路径中的架构;相反,请输入<database>/%。对于 Oracle Database,<database>是系统标识符 (SID)。

    例如,如果 Oracle 数据库有orcl作为 SID,输入orcl/%以匹配 JDCB 连接中指定的用户有权访问的所有表。

    重要

    此字段区分大小写。

  5. 在下导入目标中,指定以下参数:

    目标数据库 lakeformation_tutorial
    目标存储位置 s3://<yourName>-datalake-tutorial
    数据格式 (选择实木复合地板或 CSV)
  6. 对于导入频率,请选择按需运行.

  7. 在下导入选项中,指定以下参数:

    工作流名称 lakeformationjdbctest
    IAM 角色 LakeFormationWorkflowRole
    表前缀 jdbctest
    注意

    必须是小写字母。

  8. 选择Create,然后等待控制台报告工作流已成功创建。

    提示

    有没有收到以下错误消息?

    User: arn:aws:iam::<account-id>:user/<datalake_administrator_user> is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>:role/LakeFormationWorkflowRole...

    如果是这样,请检查您是否更换<account-id>在数据湖管理员用户的内联策略中具有有效Amazon账号。