添加触发器 - AWS Glue
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

添加触发器

您可以使用 AWS Glue 控制台、AWS Command Line Interface (AWS CLI) 或 AWS Glue API 添加触发器。

注意

目前,AWS Glue 控制台在使用触发器时仅支持作业,而不支持爬网程序。您可以使用 AWS CLI 或 AWS Glue API 来配置同时支持作业和爬网程序的触发器。

添加触发器(控制台)

  1. 登录 AWS 管理控制台,并通过打开 AWS Glue 控制台。https://console.aws.amazon.com/glue/

  2. 在导航窗格中,于 ETL 下,选择 Triggers (触发器)。选择 Add trigger (添加触发器)

  3. 提供以下属性:

    名称

    赋予您的触发器一个唯一的名称。

    触发器类型

    指定下列项之一:

    • :计划: 触发器按特定的频率和时间触发。

    • Job 事件: 条件触发器。当列表中的任何或所有作业进入其指定状态时,触发器就会触发。要让触发器触发,受监控的作业必须由触发器启动。对于您选择的任何作业,您只能监控一个作业事件(完成状态)。

    • 按需: 触发器会在激活时触发。

  4. 完成触发器向导。在存储库的审核页面上,您可以激活ScheduleJob 事件(条件)立即触发,方法是选择在创建时启用触发器

添加触发器 (AWS CLI)

  • 输入类似以下的命令。

    aws glue create-trigger --name MyTrigger --type SCHEDULED --schedule "cron(0 12 * * ? *)" --actions CrawlerName=MyCrawler --start-on-creation

    此命令会创建一个名为 MyTrigger 的计划触发器 ,该触发器每天在 UTC 时间中午 12:00 运行,并启动一个名为 MyCrawler 的爬网程序。该触发器在创建时处于激活状态。

有关更多信息,请参阅 AWS Glue 触发器