BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE

概述

当集群因 BOOTSTRAP_FAILURE_PRIMARY_WITH_NON_ZERO_CODE 错误而终止时,主实例中的引导操作已失败。有关引导操作的更多信息,请参阅 创建引导操作以安装其它软件

解析

要解决此错误,请查看 API 错误中返回的详细信息、修改您的引导操作脚本,然后使用更新的引导操作创建新集群。

要排查失败的 EMR 集群问题,请参阅 DescribeClusterListClusters API 返回的 ErrorDetail 信息。有关更多信息,请参阅包含 ErrorDetail 信息的错误代码ErrorDetail 中的 ErrorData 数组返回此错误代码的以下信息:

primary-instance-id

引导操作失败的主实例的 ID。

bootstrap-action

失败的引导操作的序号。bootstrap-action 值为 1 的脚本是在实例上运行的第一个引导操作。

return-code

失败的引导操作返回码。

amazon-s3-path

失败的引导操作的 Amazon S3 位置。

public-doc

错误代码文档的公有 URL。

完成步骤

执行以下步骤以确定和修复引导操作错误的根本原因。然后启动新集群。

  1. 查看 Amazon S3 中的引导操作日志文件,确定失败的根本原因。要了解有关如何查看 Amazon EMR 日志的更多信息,请参阅 查看日志文件

  2. 如果您在创建实例时开启了集群日志,请参阅 stdout 日志以了解更多信息。您可以在以下 Amazon S3 位置找到引导操作的 stdout 日志:

    s3://EXAMPLE-BUCKET/logs/Your_Cluster_Id/node/Primary_Instance_Id/bootstrap-actions/Failed_Bootstrap_Action_Number/stdout.gz

    有关集群的更多信息,请参阅 配置集群日志记录和调试

  3. 要确定引导操作失败,请查看 stdout 日志中的异常以及 ErrorData 中的return-code 值。

  4. 使用上一步中的发现来修改您的引导操作,使其避免异常或在异常发生时可以正常地处理异常。

  5. 使用更新的引导操作启动新集群。