对 Neptune 导出过程进行故障排除 - Amazon Neptune
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对 Neptune 导出过程进行故障排除

Amazon Neptune 导出流程使用 Amazon Batch 来预调配导出 Neptune 数据所需的计算和存储资源。运行导出操作时,您可以使用 logs 字段中的链接访问导出任务的 CloudWatch 日志。

但是,执行导出的 Amazon Batch 任务的 CloudWatch 日志仅在 Amazon Batch 任务运行时才可用。如果 Neptune 导出报告导出处于待处理状态,则不会有日志链接可供您访问 CloudWatch 日志。如果导出任务保持 pending 状态的时间超过几分钟,则预调配底层 Amazon Batch 资源可能会出现问题。

当导出任务离开待处理状态时,您可以按如下方式检查其状态:

检查 Amazon Batch 任务的状态
  1. 打开 Amazon Batch 控制台,地址:https://console.aws.amazon.com/batch/

  2. 选择 neptune-export 任务队列。

  3. 查找名称与您开始导出时由 Neptune 导出返回的 jobName 相匹配的任务。

检查状态时 Amazon Batch 控制台的屏幕截图

如果任务保持卡在 RUNNABLE 状态,则可能是因为网络或安全问题使容器实例无法加入底层的 Amazon Elastic Container Service (Amazon ECS) 集群。请参阅本支持文章中有关验证计算环境的网络和安全设置的部分。

您可以检查的另一件事是自动扩缩是否存在问题:

查看 Amazon Batch 计算环境的 Amazon EC2 自动扩缩组
  1. 通过以下网址打开 Amazon EC2 控制台:https://console.aws.amazon.com/ec2/

  2. 为 neptune-export 计算环境选择自动扩缩组。

  3. 打开活动选项卡,并查看活动历史记录中是否存在未成功的事件。

检查自动扩缩问题时 Amazon EC2 控制台的屏幕截图

Neptune 导出常见错误

org.eclipse.rdf4j.query.QueryEvaluationException: Tag mismatch!

如果 export-rdf 任务经常失败并引发 Tag mismatch! QueryEvaluationException,则 Neptune 实例的大小对于 Neptune 导出使用的大型、长时间运行的查询来说太小了。

您可以通过纵向扩展到更大的 Neptune 实例或将任务配置为从大型克隆集群中导出来避免出现此错误,如下所示:

'{ "command": "export-rdf", "outputS3Path": "s3://(your Amazon S3 bucket)/neptune-export", "params": { "endpoint": "(your Neptune endpoint DNS name)", "cloneCluster": True, "cloneClusterInstanceType" : "r5.24xlarge" } }'