本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
提供您自己的自定义脚本
脚本在 Amazon Glue 中执行提取、转换和加载 (ETL) 工作。当您为作业自动生成源代码逻辑时,将会创建一个脚本。您可以编辑这个生成的脚本,也可以提供您自己的自定义脚本。
要在 Amazon Glue 中提供您自己的自定义脚本,请遵循以下常规步骤:
-
登录 Amazon Web Services Management Console,然后打开 Amazon Glue 控制台,网址为:https://console.aws.amazon.com/glue/
。 -
选择 ETL 作业选项卡,然后查看创建作业部分。选择脚本编辑器选项。
-
在 This job runs 下,选择以下内容之一:
使用样板代码创建新脚本
-
上传和编辑现有脚本
-
在作业详细信息页面中,选择运行您的自定义脚本所需的 IAM 角色。有关更多信息,请参阅 适用于 Amazon Glue 的 Identity and Access Management。
选择您的脚本引用的任何连接。需要这些对象才能连接到必要的 JDBC 数据存储。
弹性网络接口 (ENI) 是一种虚拟网络接口,您可以将其连接至 Virtual Private Cloud(VPC)中的实例。选择连接到脚本中使用的数据存储所需的弹性网络接口。
-
提供特定于您的作业类型的额外配置,包括参数。有关您的作业类型配置的更多信息,请参阅 使用 Amazon Glue Studio 构建可视化 ETL 作业 一节。
-
在脚本选项卡上,粘贴或编写您的自定义脚本。
使用本节中的内容来指导编写自定义脚本的过程。
有关在 Amazon Glue 中添加作业的更多信息,请参阅使用 Amazon Glue Studio 构建可视化 ETL 作业。
有关分步指导,请参阅 控制台中的 Add jobAmazon Glue 教程。