本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
第 1 步:使用 Amazon CloudFormation 模板调配资源
制作者账户的 CloudFormation 模板可生成以下资源:
要用作数据湖的 Amazon S3 存储桶。
Lambda 函数(用于 Lambda 支持的 Amazon CloudFormation 自定义资源)。我们使用该函数将示例数据文件从公共 Amazon S3 存储桶复制到您的 Amazon S3 存储桶中。
IAM 用户和策略:DataLakeAdminProducer。
适当的 Lake Formation 设置和权限,包括:
在制作者账户中定义 Lake Formation 数据湖管理员
将 Amazon S3 存储桶注册为 Lake Formation 数据湖位置(制作者账户)
Amazon Glue Data Catalog 数据库、表和分区。由于有两个跨 Amazon Web Services 账户共享资源的选项,因此,此模板创建了两组单独的数据库和表。
使用者账户的 Amazon CloudFormation 模板可生成以下资源:
IAM 用户和策略:
DataLakeAdminConsumer
DataAnalyst
-
Amazon Glue Data Catalog 数据库。此数据库用于创建指向共享资源的资源链接。
在制作者账户中创建您的资源
在美国东部(弗吉尼亚州北部)区域通过 https://console.aws.amazon.com/cloudformation
登录 Amazon CloudFormation 控制台。 选择启动堆栈
。 -
选择 Next(下一步)。
对于堆栈名称,为堆栈输入名称,如
stack-producer
。-
在用户配置部分,输入
ProducerDatalakeAdminUserName
和ProducerDatalakeAdminUserPassword
的用户名和密码。 -
在 DataLakeBucketName 中,输入您的数据湖存储桶的名称。此名称需要全局唯一。
-
对于 DatabaseName 和 TableName,保留默认值。
-
选择 Next(下一步)。
-
在下一页上,选择下一步。
查看最后页面上的详细信息,然后选择我确认 Amazon CloudFormation 可以创建 IAM 资源。
选择 Create(创建)。
堆栈创建过程可能最多需要一分钟。
在使用者账户中创建您的资源
在美国东部(弗吉尼亚州北部)区域通过 https://console.aws.amazon.com/cloudformation
登录 Amazon CloudFormation 控制台。 选择启动堆栈
。 -
选择 Next(下一步)。
对于堆栈名称,为堆栈输入名称,如
stack-consumer
。-
在用户配置部分,输入
ConsumerDatalakeAdminUserName
和ConsumerDatalakeAdminUserPassword
的用户名和密码。 对于
DataAnalystUserName
和DataAnalystUserPassword
,为数据分析师 IAM 用户输入所需的用户名和密码。-
在 DataLakeBucketName 中,输入您的数据湖存储桶的名称。此名称需要全局唯一。
-
对于 DatabaseName,保留默认值。
对于
AthenaQueryResultS3BucketName
,输入用于存储 Amazon Athena 查询结果的 Amazon S3 存储桶的名称。如果没有 Amazon S3 存储桶,请创建 Amazon S3 存储桶。-
选择 Next(下一步)。
-
在下一页上,选择下一步。
查看最后页面上的详细信息,然后选择我确认 Amazon CloudFormation 可以创建 IAM 资源。
选择 Create(创建)。
堆栈创建过程可能最多需要一分钟。
注意
完成本教程的学习后,删除 Amazon CloudFormation 中的堆栈以免产生费用。根据堆栈的事件状态验证是否已成功删除资源。