与亚马逊 CloudWatch 日志集成 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

与亚马逊 CloudWatch 日志集成

从Amazon ParallelCluster版本 2.6.0 开始,默认情况下,常见日志存储在 CloudWatch 日志中。有关 CloudWatch 日志的更多信息,请参阅 Amazon CloudWatch Logs 用户指南。要配置 CloudWatch 日志集成,请参阅[cw_log]部分cw_log_settings设置。

为每个集群创建一个名称的日志组/aws/parallelcluster/cluster-name(例如,/aws/parallelcluster/testCluster)。每个节点上的每个日志(如果路径包含,则为一组日志*)都有一个名为的日志流{hostname}.{instance_id}.{logIdentifier}。(例如ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher。) 日志数据 CloudWatch 由代理发送到,该CloudWatch 代理root在所有集群实例上一样运行。

从Amazon ParallelCluster版本 2.10.0 开始,在创建集群时创建 Amazon CloudWatch 控制面板。此仪表板使您可以轻松查看存储在日志中的 CloudWatch 日志。有关更多信息,请参阅亚马逊 CloudWatch 控制面板

此列表包含 LogiDentifier 和可用于平台、调度程序和节点的日志流的路径。

可用于平台、调度程序和节点的日志流
平台 计划程序 节点 日志流

amazon

centos

ubuntu

awsbatch

泥浆

HeadNode

dcv 身份验证器:/var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent:/var/log/dcv/agent.*.log

dcv-session:/var/log/dcv/dcv-xsession.*.log

dcv 服务器:/var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv:/var/log/dcv/Xdcv.*.log

cfn-init:/var/log/cfn-init.log

厨师-客户:/var/log/chef-client.log

amazon

centos

ubuntu

awsbatch

泥浆

ComputeFleet

HeadNode

cloud-init:/var/log/cloud-init.log

主管:/var/log/supervisord.log

amazon

centos

ubuntu

泥浆

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd:/var/log/parallelcluster/computemgtd

Slurmd:/var/log/slurmd.log

amazon

centos

ubuntu

泥浆

HeadNode

clustermgtd:/var/log/parallelcluster/clustermgtd

slurm_resume:/var/log/parallelcluster/slurm_resume.log

slurm_sounded:/var/log/parallelcluster/slurm_suspend.log

slurmctld:/var/log/slurmctld.log

amazon

centos

awsbatch

泥浆

ComputeFleet

HeadNode

系统消息:/var/log/messages

ubuntu

awsbatch

泥浆

ComputeFleet

HeadNode

系统日志:/var/log/syslog

集群中使用的任务将达到RUNNINGSUCCEEDEDFAILED状态的作业的输出Amazon Batch存储在 CloudWatch 日志中。日志组是/aws/batch/job,日志流名称格式为jobDefinitionName/default/ecs_task_id。默认情况下,这些日志设置为永不过期,但您可以修改保留期。有关更多信息,请参阅 Amazon Logs 用户指南中的 “ CloudWatch 日志” 中的 “更改 CloudWatch 日志数据保留期”。

注意

chef-clientcloud-init-outputclustermgtdcomputemgtdslurm_resume、和slurm_suspend是在 2.9.0Amazon ParallelCluster 版本中添加的。对于Amazon ParallelCluster版本 2.6.0,/var/log/cfn-init-cmd.log(cfn-init-cmd) 和/var/log/cfn-wire.log (cfn-wire) 也存储在 CloudWatch 日志中。