本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
第 8 步:使用蓝图创建工作流
为了读取 CloudTrail 日志、了解其结构、在数据目录中创建相应的表,我们需要设置一个由Amazon Glue爬虫、作业、触发器和工作流组成的工作流程。Lake Formation 的蓝图简化了这一过程。
该工作流会生成作业、爬网程序和触发器,以用于发现数据并将其摄取到您的数据湖中。您可以基于其中一个预定义的 Lake Formation 蓝图创建工作流。
-
在 Lake Formation 控制台的导航窗格中,选择蓝图,然后选择使用蓝图。
-
在使用蓝图页面的蓝图类型下,选择Amazon CloudTrail。
-
在 “导入来源” 下,选择 CloudTrail 来源和开始日期。
-
在导入目标下,指定以下参数:
目标数据库 lakeformation_cloudtrail
目标存储位置 s3://
<yourName>
-datalake-cloudtrailData format(数据格式) Parquet -
对于导入频率,选择按需运行。
-
在导入选项下,指定以下参数:
工作流名称 lakeformationcloudtrailtest
IAM 角色 LakeFormationWorkflowRole
表前缀 cloudtrailtest
注意
必须小写。
-
选择创建,然后等待控制台报告已成功创建工作流。
提示
您是否收到了以下错误消息?
User: arn:aws:iam::
<account-id>
:user/<datalake_administrator_user>
is not authorized to perform: iam:PassRole on resource:arn:aws:iam::<account-id>
:role/LakeFormationWorkflowRole...如果是,请检查您是否<account-id>将数据湖管理员用户的内联策略替换
为有效的 Amazon 账号。