安排爬网程序以保持 Amazon Glue Data Catalog 和 Amazon S3 同步 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

安排爬网程序以保持 Amazon Glue Data Catalog 和 Amazon S3 同步

Amazon Glue 爬网程序可以设置为按计划或按需运行。有关更多信息,请参阅《Amazon Glue 开发人员指南》中的基于时间的任务和爬网程序安排

如果您的数据在固定时间到达分区表,则可以设置 Amazon Glue 爬网程序按计划运行以检测和更新表分区。这样就不需要运行耗时长且昂贵的 MSCK REPAIR 命令或手动运行 ALTER TABLE ADD PARTITION 命令。有关更多信息,请参阅《Amazon Glue 开发人员指南》中的表分区