尝试更新集群 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

尝试更新集群

pcluster update-cluster命令无法在本地运行

请查看本地文件系统~/.parallelcluster/pcluster-cli.log中的故障详细信息。

clusterStatusUPDATE_FAILEDpcluster describe-cluster命令看见

如果集群堆栈更新回滚,请检查/var/log/chef-client.logs文件中的错误详细信息。

查看上的 “GitHub 已知问题” 中是否提到了您的问题 GitHub。Amazon ParallelCluster

集群更新超时

这可能是与cfn-hup无法运行有关的问题。如果cfn-hup恶魔是由外部原因终止的,它不会自动重启。如果cfn-hup未运行,则在集群更新期间, CloudFormation 堆栈会按预期启动更新过程,但更新过程未在头节点上激活,堆栈部署最终会超时。有关更多信息,请参阅排查排除cfn-hup未运行时的集群更新超时故障,并从问题排查。