从 Amazon CloudTrail 源头创建数据湖 - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

从 Amazon CloudTrail 源头创建数据湖

本教程将指导您完成在 Lake Formation 控制台上执行的操作,以便从 Amazon CloudTrail 源头创建和加载您的第一个数据湖。

创建数据湖的主要步骤
  1. 将 Amazon Simple Storage Service (Amazon S3) 路径注册为数据湖。

  2. 授予向数据目录以及数据湖中的 Amazon S3 位置写入数据的 Lake Formation 权限。

  3. 创建数据库以整理数据目录中的元数据表。

  4. 使用蓝图创建工作流。运行工作流以从数据来源摄取数据。

  5. 设置您的 Lake Formation 权限,以允许其他人管理数据目录和数据湖中的数据。

  6. 设置 Amazon Athena,以查询您导入到 Amazon S3 数据湖中的数据。

  7. 对于一些数据存储类型,设置 Amazon Redshift Spectrum 以查询您导入到 Amazon S3 数据湖中的数据。