本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 1:使用 Amazon CloudFormation 模板配置资源
制作者账户的 CloudFormation 模板生成以下资源:
要用作数据湖的 Amazon S3 存储桶。
一个 Lambda 函数(用于 Lambda 支持的自定义资源 Amazon CloudFormation )。我们使用该函数将示例数据文件从公共 Amazon S3 存储桶复制到您的 Amazon S3 存储桶中。
IAM 用户和策略: DataLakeAdminProducer.
适当的 Lake Formation 设置和权限,包括:
在制作者账户中定义 Lake Formation 数据湖管理员
将 Amazon S3 存储桶注册为 Lake Formation 数据湖位置(制作者账户)
Amazon Glue Data Catalog 数据库、表和分区。由于有两种共享资源的选项 Amazon Web Services 账户,因此此模板创建了两组独立的数据库和表。
消费者账户的 Amazon CloudFormation 模板生成以下资源:
IAM 用户和策略:
DataLakeAdminConsumer
DataAnalyst
-
一个 Amazon Glue Data Catalog 数据库。此数据库用于创建指向共享资源的资源链接。
在制作者账户中创建您的资源
在美国东部(弗吉尼亚北部)地区通过 https://console.aws.amazon.com/cloudformation
登录 Amazon CloudFormation 控制台。 选择启动堆栈
。 -
选择下一步。
对于堆栈名称,为堆栈输入名称,如
stack-producer
。-
在用户配置部分,输入
ProducerDatalakeAdminUserName
和ProducerDatalakeAdminUserPassword
的用户名和密码。 -
对于 DataLakeBucketName,请输入您的数据湖存储桶的名称。此名称需要全局唯一。
-
对于DatabaseName和 TableName,保留默认值。
-
选择下一步。
-
在下一页上,选择下一步。
查看最后一页上的详细信息,然后选择我确认这 Amazon CloudFormation 可能会创建 IAM 资源。
选择创建。
堆栈创建过程可能最多需要一分钟。
在使用者账户中创建您的资源
在美国东部(弗吉尼亚北部)地区通过 https://console.aws.amazon.com/cloudformation
登录 Amazon CloudFormation 控制台。 选择启动堆栈
。 -
选择下一步。
对于堆栈名称,为堆栈输入名称,如
stack-consumer
。-
在用户配置部分,输入
ConsumerDatalakeAdminUserName
和ConsumerDatalakeAdminUserPassword
的用户名和密码。 对于
DataAnalystUserName
和DataAnalystUserPassword
,为数据分析师 IAM 用户输入所需的用户名和密码。-
对于 DataLakeBucketName,请输入您的数据湖存储桶的名称。此名称需要全局唯一。
-
对于 DatabaseName,保留默认值。
对于
AthenaQueryResultS3BucketName
,输入用于存储 Amazon Athena 查询结果的 Amazon S3 存储桶的名称。如果没有 Amazon S3 存储桶,请创建 Amazon S3 存储桶。-
选择下一步。
-
在下一页上,选择下一步。
查看最后一页上的详细信息,然后选择我确认这 Amazon CloudFormation 可能会创建 IAM 资源。
选择创建。
堆栈创建过程可能最多需要一分钟。
注意
完成教程后,删除中的堆栈 Amazon CloudFormation 以免产生费用。根据堆栈的事件状态验证是否已成功删除资源。