BOOTSTRAP_FAILURE_FILE_NOT_FOUND_PRIMARY - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

BOOTSTRAP_FAILURE_FILE_NOT_FOUND_PRIMARY

概述

BOOTSTRAP_FAILURE_FILE_NOT_FOUND_PRIMARY 错误表示主实例找不到该实例刚刚从指定的 Amazon S3 存储桶下载的引导操作脚本。

解析

要解决此错误,请确保您的主实例具有对引导操作脚本的适当访问权限。

要排查失败的 EMR 集群问题,请参阅 DescribeClusterListClusters API 返回的 ErrorDetail 信息。有关更多信息,请参阅包含 ErrorDetail 信息的错误代码ErrorDetail 中的 ErrorData 数组返回此错误代码的以下信息:

primary-instance-id

引导操作失败的主实例的 ID。

bootstrap-action

失败的引导操作的序号。bootstrap-action 值为 1 的脚本是在实例上运行的第一个引导操作。

amazon-s3-path

失败的引导操作的 Amazon S3 位置。

public-doc

错误代码文档的公有 URL。

完成步骤

执行以下步骤以确定和修复引导操作错误的根本原因。然后启动新集群。

  1. 要在 Amazon S3 中查找相关的引导操作脚本,请使用 ErrorData 数组中的 amazon-s3-path 值。

  2. 查看 Amazon S3 中的引导操作日志文件,确定失败的根本原因。要了解有关如何查看 Amazon EMR 日志的更多信息,请参阅 查看日志文件

    注意

    如果您没有为集群开启日志,则必须使用相同的配置和引导操作创建一个新集群。要确保集群日志已开启,请参阅 配置集群日志记录和调试

  3. 查看 stdout 日志以了解您的引导操作,并确认没有自定义流程可以删除主实例上 /emr/instance-controller/lib/bootstrap-actions 文件夹中的文件。您可以在以下 Amazon S3 位置找到引导操作的 stdout 日志:

    s3://EXAMPLE-BUCKET/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz
  4. 使用更新的引导操作启动新集群。