本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
与 Amazon 集成CloudWatch日志
有关 的更多信息CloudWatch日志,请参阅亚马逊CloudWatch日志用户指南. 配置CloudWatch日志集成,请参阅Monitoring 部分.
为每个集群创建一个具有名称的日志组/aws/parallelcluster/
(例如,cluster-name-<timestamp>
/aws/parallelcluster/testCluster-202202050215
)。每个日志(或一组日志,如果路径包含*
) 在每个节点上都有一个名为
. (例如{hostname}
.{instance_id}
.{logIdentifier}
ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher
。) 日志数据被发送到CloudWatch通过CloudWatch代理人,它运行为root
在所有集群实例上。
AmazonCloudWatch在创建集群时会创建仪表板。此仪表板使您可以轻松查看存储在中的日志CloudWatch日志。有关更多信息,请参阅 亚马逊CloudWatch仪表板。
此列表包含日志的路径和logIdentifier
用于那些日志。
-
/var/log/cfn-init.log
(cfn-init
) -
/var/log/chef-client.log
(chef-client
) -
/var/log/cloud-init.log
(cloud-init
) -
/var/log/cloud-init-output.log
(cloud-init-output
) -
/var/log/dcv/agent.*.log
(dcv-agent
) -
/var/log/dcv/dcv-xsession.*.log
(dcv-xsession
) -
/var/log/dcv/server.log
(dcv-server
) -
/var/log/dcv/sessionlauncher.log
(dcv-session-launcher
) -
/var/log/dcv/Xdcv.*.log
(Xdcv
) -
/var/log/messages
(system-messages
) -
/var/log/parallelcluster/clustermgtd
(clustermgtd
) -
/var/log/parallelcluster/computemgtd
(computemgtd
) -
/var/log/parallelcluster/pcluster_dcv_authenticator.log
(dcv-authenticator
) -
/var/log/parallelcluster/pcluster_dcv_connect.log
(dcv-ext-authenticator
) -
/var/log/parallelcluster/slurm_resume.log
(slurm_resume
) -
/var/log/parallelcluster/slurm_suspend.log
(slurm_suspend
) -
/var/log/slurmctld.log
(slurmctld
) -
/var/log/slurmd.log
(slurmd
) -
/var/log/supervisord.log
(supervisord
) -
/var/log/syslog
(syslog
)
使用的群集中的作业Amazon Batch存储达到的作业输出RUNNING
、SUCCEEDED
,或者FAILED
中的状态CloudWatch日志。日志组是/aws/batch/job
,日志流名称格式为
. 默认情况下,这些日志设置为永不过期,但您可以修改保留期。有关更多信息,请参阅 。更改中的日志数据留存CloudWatch日志中的亚马逊CloudWatch日志用户指南.jobDefinitionName
/default/ecs_task_id