排查网络排查 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

排查网络排查

单个公有子网中的集群问题

检查cloud-init-output.log来自其中一个计算节点的。如果您发现类似以下内容表明节点在Slurm初始化中卡住,则很可能是由于缺少 DynamoDB VPC 终端节点。添加 DynamoDB 端点。有关更多信息,请参阅 Amazon ParallelCluster在无法访问 Internet 的单个子网中

ruby_block[retrieve compute node info] action run[2022-03-11T17:47:11+00:00] INFO: Processing ruby_block[retrieve compute node info] action run (aws-parallelcluster-slurm::init line 31)