步骤 5:检查已暂停的组
如果尝试启动节点时遇到太多错误,实例组就会进入暂停状态。例如,如果新节点在执行引导操作时反复失败,实例组将在一段时间后进入 SUSPENDED
状态,而不是继续尝试供应新节点。
在以下情况中,节点可能无法出现:
-
Hadoop 或该集群不知是何原因损坏,不接受新节点进入集群
-
新节点的引导操作失败
-
该节点无法正常工作,未能签入 Hadoop
如果实例组处于 SUSPENDED
状态,集群处于 WAITING
状态,您可以添加一个集群步骤,以重置所需核心节点和任务节点的数量。添加该步骤可恢复集群的处理,使实例组重回 RUNNING
状态。
有关如何重置暂停状态下的集群的详细信息,请参阅“暂停”状态。