本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
与 Amazon CloudWatch 日志集成
从 Amazon ParallelCluster 版本 2.6.0 开始,默认情况下,常用日志存储在 CloudWatch 日志中。有关 CloudWatch 日志的更多信息,请参阅 Amazon CloudWatch 日志用户指南。要配置 CloudWatch 日志集成,请参阅[cw_log]部分和cw_log_settings设置。
将为每个集群创建一个名为 /aws/parallelcluster/
的日志组(例如 cluster-name
/aws/parallelcluster/testCluster
)。每个节点上的每个日志(如果路径包含 *
,则为一组日志)都有一个名为
的日志流。(例如 {hostname}
.{instance_id}
.{logIdentifier}
ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher
。) 日志数据 CloudWatch 由代理发送到,该CloudWatch 代理像root
在所有集群实例上一样运行。
从 Amazon ParallelCluster 版本 2.10.0 开始,在创建集群时会创建一个 Amazon CloudWatch 控制面板。通过此控制面板,您可以轻松查看存储在日志中的 CloudWatch 日志。有关更多信息,请参阅 亚马逊 CloudWatch 控制面板。
此列表包含 logIdentifier
以及可用于平台、调度器和节点的日志流的路径。
平台 | 调度器 | Nodes | 日志流 |
---|---|---|---|
amazon centos ubuntu |
awsbatch slurm |
HeadNode |
dcv-authenticator: dcv-ext-authenticator: dcv-agent: dcv-xsession: dcv-server: dcv-session-launcher: Xdcv: cfn-init: chef-client: |
amazon centos ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
cloud-init: supervisord: |
amazon centos ubuntu |
slurm |
ComputeFleet |
cloud-init-output: computemgtd: slurmd: |
amazon centos ubuntu |
slurm |
HeadNode |
clustermgtd: slurm_resume: slurm_suspend: slurmctld: |
amazon centos |
awsbatch slurm |
ComputeFleet HeadNode |
system-messages: |
ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
syslog: |
使用集群中的作业将达到RUNNING
SUCCEEDED
、或FAILED
状态的任务的输出 Amazon Batch 存储在 CloudWatch 日志中。日志组为 /aws/batch/job
,日志流名称格式为
。默认情况下,这些日志设置为永不过期,但您可以修改保留期。有关更多信息,请参阅《Amazon 日志用户指南》中的 “ CloudWatch 日志” 中的更改 CloudWatch 日志数据保留期。jobDefinitionName
/default/ecs_task_id
注意
chef-client
、、cloud-init-output
、clustermgtd
computemgtd
、和slurm_resume
,slurm_suspend
已在 2.9.0 Amazon ParallelCluster 版本中添加。对于 Amazon ParallelCluster 版本 2.6.0,/var/log/cfn-init-cmd.log
(cfn-init-cmd
) 和 /var/log/cfn-wire.log
(cfn-wire
) 也存储在 CloudWatch 日志中。