创建ETL作业 AWS Glue Studio - AWS Glue Studio
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建ETL作业 AWS Glue Studio

您可以使用中的简单图形界面 AWS Glue Studio 创建ETL作业。您使用 管理作业 页面,创建新作业。

管理作业 您可以看到您创建的所有工作, AWS Glue Studio 或 AWS Glue 控制台。您可以在此页面上查看、管理和运行作业。

开始作业创建过程

您可以使用可视化图表编辑器来创建和自定义作业。创建新作业时,您可以选择从空画布、仅具有源节点的作业图或具有数据源、转换和数据目标节点的作业图开始。

  1. 访问 管理作业 第页。您可以选择 创建和管理作业 从 AWS Glue Studio 登录页面,或者您可以选择 工作 从导航窗格。

  2. 创建作业 部分,为您的作业选择配置选项。

    • 要创建以空画布开头的作业,请选择 空白图表.

    • 要创建以源节点或源节点开始的作业、转换和目标节点,请选择 添加到图表的源和目标.

      然后选择数据源类型。您也可以选择数据目标类型,或者选择 稍后选择 选项以图表中的数据源节点开头。

      数据目标可以是 Amazon S3 或 AWS Glue 数据目录。

      有关在中创建表的更多信息 Data Catalog,请参阅 在AWS胶水数据目录中定义表AWS Glue 开发人员指南.

  3. 选择 创建 打开可视作业编辑器。

在中创建作业的后续步骤 AWS Glue Studio

您可以使用可视作业编辑器在图表中为作业配置节点。每个节点表示操作,例如从源位置读取数据或应用转换到数据。您添加到作业图表的每个节点都具有提供数据位置或转换的相关信息的属性。

创建和管理作业的后续步骤如下: