编辑或上载作业脚本 - AmazonGlue 工作室
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

编辑或上载作业脚本

使用AmazonGlue Studio 可视化编辑器来编辑作业脚本或上传您自己的脚本。

只有在使用可视化编辑器创建作业节点时,才能使用可视化编辑器编辑作业节点。AmazonGlue 工作室 如果作业是使用Amazon Glue控制台、通过 API 命令或使用命令行界面 (CLI) 时,您可以在AmazonGlue Studio 编辑作业脚本、参数和计划。您也可以编辑在AmazonGlue 合工作室通过将作业转换为仅脚本模式。

编辑作业脚本或上传您自己的脚本

  1. 如果创建新作业,请在作业页面上,选择代码编辑器选项。在开发人员模式选项部分,您可以选择以空白脚本(在编辑器中编写代码),也可以上传用作作业脚本的本地文件。

    您只能选择要上传的 Python 脚本或 Scala 脚本。Scala 脚本必须具有文件扩展名.scala。必须将 Python 脚本识别为 Python 类型的文件。

  2. 转到新作业或已保存作业的可视作业编辑器,然后选择Script选项卡。

  3. 如果没有使用创建新作业代码编辑器选项,并且您从未编辑过现有作业的脚本,Script选项卡显示标题脚本(锁定)。这意味着脚本编辑器处于只读模式。选择Edit Script解锁脚本以进行编辑。

    要使脚本可以编辑,AmazonGlue Studio 将您的作业从可视化作业转换为仅脚本作业。如果解锁脚本以进行编辑,则之后无法为此作业使用可视化编辑器。

    在确认窗口中,选择确认以继续或Cancel以保持作业可用于可视化编辑。

    如果选择确认时,编辑器中不再显示 Visual (可视化) 选项卡。您可以使用AmazonGlue Studio 使用代码编辑器修改脚本、修改作业详细信息或调度,或查看作业运行。

    注意

    在保存作业之前,更改不是永久性的。如果在保存作业之前关闭作业并在可视编辑器中重新打开它,则仍然可以在可视编辑器中编辑各个节点。

  4. 根据需要编辑脚本。

    编辑完脚本后,选择脚本后,选择Save保存作业并将作业从视觉对象永久转换为仅脚本。

  5. (可选)您可以从AmazonGlue 工作室控制台,通过选择下载按钮Script选项卡。选择此按钮后,将打开一个新的浏览器窗口,其中显示脚本在 Amazon S3 中的位置。这些区域有:脚本文件脚本路径中的参数Job 详细信息选项卡确定脚本文件在 Amazon S3 中的名称和位置。

    
            屏幕截图显示可视编辑器Amazon选中 “作业详细信息” 选项卡的胶 Job 室。此页上的 “高级属性” 部分将展开,并显示 “脚本文件名和脚本路径” 参数。脚本文件名字段显示 “连接测试 job.py”,脚本路径字段显示 “s3: //aws-胶资产-111122223333-u”。

    保存作业时,Amazon Glue将作业脚本保存在这些字段指定的位置。如果您在 Amazon S3 中修改此位置的脚本文件,AmazonGlue Studio 将在您下次编辑作业时加载修改后的脚本。