与 Amazon CloudWatch Logs - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

与 Amazon CloudWatch Logs

有关 CloudWatch 日志的更多信息,请参阅 Amazon CloudWatch Logs 用户指南。要配置 CloudWatch 日志集成,请参阅Monitoring部分。要了解如何使用将自定义日志附加到 CloudWatch 配置中append-config,请参阅 Amazon CloudWatch 用户指南中的多个 CloudWatch 代理配置文件

亚马逊 CloudWatch 日志集群日志

为每个集群创建一个名称为的日志组/aws/parallelcluster/cluster-name-<timestamp>(例如,/aws/parallelcluster/testCluster-202202050215)。每个节点上的每个日志(如果路径包含,则为一组日志*)都有一个名为的日志流{hostname}.{instance_id}.{logIdentifier}。(例如ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher。) 日志数据 CloudWatch 由代理发送到,该CloudWatch 代理root在所有集群实例上一样运行。

Amazon Lo CloudWatch gs Uson Logs User Guide U 此仪表板使您能够查看存储在日志中的 CloudWatch 日志。有关更多信息,请参阅亚马逊 CloudWatch 控制面板

此列表包含 LogiDentifier 和可用于平台、调度程序和节点的日志流的路径。

可用于平台、调度程序和节点的日志流
平台 计划程序 节点 日志流

amazon

centos

ubuntu

awsbatch

泥浆

HeadNode

dcv 身份验证器:/var/log/parallelcluster/pcluster_dcv_authenticator.log

dcv-ext-authenticator: /var/log/parallelcluster/pcluster_dcv_connect.log

dcv-agent:/var/log/dcv/agent.*.log

dcv-session:/var/log/dcv/dcv-xsession.*.log

dcv 服务器:/var/log/dcv/server.log

dcv-session-launcher: /var/log/dcv/sessionlauncher.log

Xdcv:/var/log/dcv/Xdcv.*.log

cfn-init Unit/var/log/cfn-init.log

厨师-客户:/var/log/chef-client.log

amazon

centos

ubuntu

awsbatch

泥浆

ComputeFleet

HeadNode

cloud-init:/var/log/cloud-init.log

主管:/var/log/supervisord.log

amazon

centos

ubuntu

泥浆

ComputeFleet

cloud-init-output: /var/log/cloud-init-output.log

computemgtd:/var/log/parallelcluster/computemgtd

Slurmd:/var/log/slurmd.log

slurm_prolog_epilog:/var/log/parallelcluster/slurm_prolog_epilog.log

amazon

centos

ubuntu

泥浆

HeadNode

sssd:/var/log/sssd/sssd.log

sssd_domain_默认:/var/log/sssd/sssd_default.log

pam_ssh_key_generator:/var/log/parallelcluster/pam_ssh_key_generator.log

clustarstatusmgtd:/var/log/parallelcluster/clusterstatusmgtd

clustermgtd:/var/log/parallelcluster/clustermgtd

compute_console_输出:/var/log/parallelcluster/compute_console_output

slurm_resume:/var/log/parallelcluster/slurm_resume.log

slurm_sounded:/var/log/parallelcluster/slurm_suspend.log

slurmctld:/var/log/slurmctld.log

slurm_fleet_status_manager:/var/log/parallelcluster/slurm_fleet_status_manager.log

amazon

centos

awsbatch

泥浆

ComputeFleet

HeadNode

系统消息:/var/log/messages

ubuntu

awsbatch

泥浆

ComputeFleet

HeadNode

系统日志:/var/log/syslog

集群中使用的任务将达到RUNNINGSUCCEEDED或状态的作业的输出Amazon Batch存储FAILED在 CloudWatch 日志中。日志组是/aws/batch/job,日志流名称格式为jobDefinitionName/default/ecs_task_id。默认情况下,这些日志设置为不会过期,但您可以修改保留期。有关更多信息,请参阅 Amazon Log CloudWatch s User Guide 中的更改 Amazon Logs 中的 CloudWatch 日志数据保留期

亚马逊 CloudWatch 日志生成图像日志

为每个自定义构建映像创建一个名为、的日志组/aws/imagebuilder/ParallelClusterImage-<image-id>。一个名{pcluster-version} /1 的唯一日志流包含构建映像过程的输出。

您可以使用pcluster图像命令访问日志。有关更多信息,请参阅 Amazon ParallelClusterAMI 自定义