提供您自己的自定义脚本 - Amazon Glue
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

提供您自己的自定义脚本

脚本在中执行提取、转换和加载 (ETL) 工作。 Amazon Glue当您为作业自动生成源代码逻辑时,将会创建一个脚本。您可以编辑这个生成的脚本,也可以提供您自己的自定义脚本。

要在 Amazon Glue 中提供您自己的自定义脚本,请遵循以下常规步骤:
  1. 登录 Amazon Web Services Management Console 并打开Amazon Glue控制台,网址为 https://console.aws.amazon.com/glue/

  2. 选择 ETL 作业选项卡,然后查看创建作业部分。选择脚本编辑器选项。

  3. This job runs 下,选择以下内容之一:

    • 使用样板代码创建新脚本

    • 上传和编辑现有脚本

  4. 作业详细信息页面中,选择运行您的自定义脚本所需的 IAM 角色。有关更多信息,请参阅适用于 Amazon Glue 的 Identity and Access Management

  5. 选择您的脚本引用的任何连接。需要这些对象才能连接到必要的 JDBC 数据存储。

    弹性网络接口 (ENI) 是一种虚拟网络接口,您可以将其连接至 Virtual Private Cloud(VPC)中的实例。选择连接到脚本中使用的数据存储所需的弹性网络接口。

  6. 提供特定于您的作业类型的额外配置,包括参数。有关您的作业类型配置的更多信息,请参阅 使用 Amazon Glue Studio 构建可视化 ETL 作业 一节。

  7. 脚本选项卡上,粘贴或编写您的自定义脚本。

使用本节中的内容来指导编写自定义脚本的过程。

有关在 Amazon Glue 中添加作业的更多信息,请参阅使用 Amazon Glue Studio 构建可视化 ETL 作业

有关 step-by-step 指导,请参阅Amazon Glue控制台中的添加作业教程。