在 AWS Glue 中注册蓝图 - AWS Glue
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 AWS Glue 中注册蓝图

AWS Glue 蓝图功能为 AWS Glue 的预览版,可能会发生变化。

AWS Glue 开发人员编写蓝图并将 ZIP 档案上传到 Amazon Simple Storage Service (Amazon S3) 后,AWS Glue 管理员必须注册该蓝图。注册蓝图使其可供使用。

当您注册蓝图时,AWS Glue 会将蓝图档案复制到预留的 Amazon S3 位置。然后,您可以从上传位置删除档案。

要注册蓝图,您需要对包含已上传档案的 Amazon S3 位置具有读取权限。您还需要 AWS Identity and Access Management (IAM) 权限。glue:CreateBlueprint。有关必须注册、查看和维护蓝图的 AWS Glue 管理员的建议权限,请参阅适用于蓝图的 AWS Glue 合管理员权限

您可以使用 AWS Glue 控制台、AWS Glue API 或 AWS Command Line Interface (AWS CLI) 注册蓝图。

要注册蓝图,请执行以下操作:

  1. 确保具有读权限 (s3:GetObject) 在 Amazon S3 中的蓝图 ZIP 存档。

  2. 在以下位置打开 AWS Glue 控制台:https://console.aws.amazon.com/glue/

    以具有权限注册蓝图的用户身份登录。切换到与包含蓝图 ZIP 存档的 Amazon S3 存储桶相同的 AWS 区域。

  3. 在导航窗格中,选择蓝图。然后在蓝图页面上,选择添加蓝图

  4. 输入蓝图名称和可选描述。

  5. 适用于ZIP 存档位置 (S3)中,输入已上传蓝图 ZIP 档案的 Amazon S3 路径。在路径中包含存档文件名,并以s3://

  6. (可选)添加一个或多个标签。

  7. 选择添加蓝图

    这些区域有:蓝图页面返回并显示蓝图状态为CREATING。选择刷新按钮,直到状态更改为ACTIVE或者FAILED

  8. 如果状态为FAILED,选择蓝图,然后在操作菜单上,选择查看

    详情页面显示失败的原因。如果错误消息为 "Unable to access object at location..." 或者 "Access denied on object at location...",请检查以下要求:

    • 您登录身份的用户必须对 Amazon S3 中的蓝图 ZIP 存档具有读取权限。

    • 包含 ZIP 档案的 Amazon S3 存储桶必须具有一个存储桶策略,该策略向您的 AWS 账户 ID 授予对数据元的读取权限。有关更多信息,请参阅 在 AWS Glue 中开发蓝图

    • 您使用的 Amazon S3 存储桶必须与您在控制台上登录的区域位于同一区域。

  9. 确保数据分析人员对蓝图具有权限。

    针对数据分析师的建议 IAM 策略如蓝图的数据分析员权限。本政策授予glue:GetBlueprint在任何资源上。如果您的策略在资源级别更精细,请授予数据分析员对此新创建的资源的权限。

要注册蓝图 (AWS CLI),请执行以下操作:

  1. 输入以下命令。

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. 输入以下命令可检查蓝图状态。重复该命令,直到状态变为ACTIVE或者FAILED

    aws glue get-blueprint --name <blueprint-name>

    如果状态为FAILED,错误消息是 "Unable to access object at location..." 或者 "Access denied on object at location...",请检查以下要求:

    • 您登录身份的用户必须对 Amazon S3 中的蓝图 ZIP 存档具有读取权限。

    • 包含 ZIP 档案的 Amazon S3 存储桶必须具有一个存储桶策略,该策略向您的 AWS 账户 ID 授予对数据元的读取权限。有关更多信息,请参阅 发布蓝图

    • 您使用的 Amazon S3 存储桶必须与您在控制台上登录的区域位于同一区域。

另请参阅: