在 Amazon Glue 中注册蓝图 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon Glue 中注册蓝图

在 Amazon Glue 开发人员已编码蓝图并将 ZIP 格式归档上传到 Amazon Simple Storage Service(Amazon S3)后,Amazon Glue 管理员必须注册蓝图。注册蓝图使其可供使用。

注册蓝图时,Amazon Glue 将蓝图归档复制到预留的 Amazon S3 位置。然后,您可以从上传位置删除归档。

如要注册蓝图,您需要对包含上传归档的 Amazon S3 位置具有读取权限。您还需要 Amazon Identity and Access Management(IAM)权限 glue:CreateBlueprint。有关必须注册、查看和维护蓝图的 Amazon Glue 管理员的建议权限,请参阅 蓝图的 Amazon Glue 管理员权限

您可以使用 Amazon Glue 控制台、Amazon Glue API 或 Amazon Command Line Interface(Amazon CLI)来注册蓝图。

注册蓝图(控制台)
  1. 确保您对 Amazon S3 中的蓝图 ZIP 格式归档具有读取权限(s3:GetObject)。

  2. 打开 Amazon Glue 控制台,地址:https://console.aws.amazon.com/glue/

    以具有蓝图注册权限的用户身份登录。切换到包含蓝图 ZIP 格式归档的 Amazon S3 存储桶所在的相同 Amazon 区域。

  3. 在导航窗格中,选择 blueprints(蓝图)。然后在 blueprints(蓝图)页面上,选择 Add blueprint(添加蓝图)

  4. 输入蓝图名称和可选说明。

  5. ZIP archive location (S3) (ZIP 归档位置 (S3)) 中,输入已上传蓝图 ZIP 格式归档的 Amazon S3 路径。在路径中包含归档文件名,并以 s3:// 作为路径的开头。

  6. (可选)添加一个或多个标签。

  7. 选择 Add blueprint (添加蓝图)

    返回 blueprints(蓝图)页面,蓝图状态显示为 CREATING。选择刷新按钮,直到状态更改为 ACTIVE 或者 FAILED

  8. 如果状态为 FAILED,则选择蓝图,然后在 Actions (操作) 菜单上,选择 View (查看)

    详细信息页面会显示故障原因。如果错误消息为“Unable to access object at location...”或者“Access denied on object at location...”,请检查以下要求:

    • 您在登录时使用的用户身份必须对 Amazon S3 中的蓝图 ZIP 格式归档具有读取权限。

    • 包含 ZIP 格式归档的 Amazon S3 存储桶必须具有存储桶策略,该策略会为您的 Amazon 账户 ID 授予对象读取权限。有关更多信息,请参阅Amazon Glue 中的开发蓝图

    • 您使用的 Amazon S3 存储桶必须位于您在控制台上登录的相同区域。

  9. 确保数据分析人员对蓝图具有相应的权限。

    针对数据分析人员的建议 IAM policy 如蓝图的数据分析人员权限所述。该策略授予对任何资源的 glue:GetBlueprint 权限。如果您的策略在资源级别更精细,则授予数据分析人员对此新建资源的权限。

注册蓝图(Amazon CLI)
  1. 输入以下命令。

    aws glue create-blueprint --name <blueprint-name> [--description <description>] --blueprint-location s3://<s3-path>/<archive-filename>
  2. 要检查蓝图状态,请输入以下命令。重复该命令,直到状态变为 ACTIVE 或者 FAILED

    aws glue get-blueprint --name <blueprint-name>

    如果状态为 FAILED 并且错误消息为“Unable to access object at location...”“Access denied on object at location...”,请检查以下要求:

    • 您在登录时使用的用户身份必须对 Amazon S3 中的蓝图 ZIP 格式归档具有读取权限。

    • 包含 ZIP 格式归档的 Amazon S3 存储桶必须具有存储桶策略,该策略会为您的 Amazon 账户 ID 授予对象读取权限。有关更多信息,请参阅发布蓝图

    • 您使用的 Amazon S3 存储桶必须位于您在控制台上登录的相同区域。