使用 创建 ETL 作业AmazonGlue 工作室 - AmazonGlue 工作室
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 创建 ETL 作业AmazonGlue 工作室

您可以使用简单的视觉界面AmazonGlue 工作室创建您的 ETL 工作。您可以使用作业页面创建新作业。

在存储库的作业页面上,您可以看到您已创建的所有作业,或使用AmazonGlue 工作室或Amazon Glue。您可以在此页面上查看、管理和运行您的作业。

启动作业创建过程

您可以使用可视化编辑器创建和自定义作业。创建新作业时,您可以选择从空画布、具有数据源的作业、转换和数据目标节点开始,或者编写 ETL 脚本。

在AmazonGlue 工作室

  1. 登录到Amazon Web Services Management Console并打开AmazonGlue 工作室控制台https://console.aws.amazon.com/gluestudio/

  2. 您可以选择创建和管理作业来自 的AmazonGlue 工作室登录页面,或者您可以选择作业从导航窗格中选择。

    此时将显示 Jobs (任务) 页面。

  3. 创建作业部分中,为您的作业选择一个配置选项。

    • 要创建以空画布开始的作业,请选择Blank 图

    • 要创建以源节点开始或源节点、转换节点和目标节点开始的作业,请选择已添加到图形中的源和目标

      然后,选择数据源的类型。您还可以选择数据目标类型,也可以选择稍后选择选项以仅以图形中的数据源节点开始。

    • 对于熟悉编程和编写 ETL 脚本的用户,您可以选择代码编辑器创建新作业。然后,您可以选择在代码编辑器窗口中编写代码,或从本地文件上传现有脚本。如果选择使用代码编辑器,则无法使用可视化作业编辑器。

  4. 选择Create打开可视作业编辑器。

创建使用连接器的作业

将连接器添加到AmazonGlue Studio 并为该连接器创建了一个连接,则可以创建一个使用数据源连接的作业。

有关详细说明,请参阅使用自定义连接器创作作业

在中创建作业的后续步骤AmazonGlue 工作室

您可以使用可视化作业编辑器为作业配置节点。每个节点都表示一个操作,例如从源位置读取数据或对数据应用转换。添加到作业的每个节点都具有提供有关数据位置或转换的信息的属性。

创建和管理作业的后续步骤包括: