与 Amazon 集成 CloudWatch 日志 - Amazon ParallelCluster
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

与 Amazon 集成 CloudWatch 日志

有关 的更多信息 CloudWatch 日志,请参阅亚马逊 CloudWatch Logs 用户指南. 配置 CloudWatch 日志集成,请参阅Monitoring部分。了解如何将自定义日志附加到 CloudWatch 使用配置append-config请参阅多个 CloudWatch 代理配置文件中的亚马逊 CloudWatch 用户指南.

亚马逊 CloudWatch 记录集群日志

为每个集群创建一个具有名称的日志组/aws/parallelcluster/cluster-name-<timestamp>(例如,/aws/parallelcluster/testCluster-202202050215)。每个日志(或一组日志,如果路径包含*) 在每个节点上都有一个名为{hostname}.{instance_id}.{logIdentifier}. (例如ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher。) 日志数据被发送到 CloudWatch 通过CloudWatch 代理,它运行为root在所有集群实例上。

Amazon CloudWatch 创建集群时将创建仪表板。此仪表板使您可以轻松查看存储在中的日志 CloudWatch 日志。有关更多信息,请参阅 亚马逊 CloudWatch 仪表板

此列表包含日志的路径和logIdentifier用于那些日志。

  • /var/log/cfn-init.log (cfn-init)

  • /var/log/chef-client.log (chef-client)

  • /var/log/cloud-init.log (cloud-init)

  • /var/log/cloud-init-output.log (cloud-init-output)

  • /var/log/dcv/agent.*.log (dcv-agent)

  • /var/log/dcv/dcv-xsession.*.log (dcv-xsession)

  • /var/log/dcv/server.log (dcv-server)

  • /var/log/dcv/sessionlauncher.log (dcv-session-launcher)

  • /var/log/dcv/Xdcv.*.log (Xdcv)

  • /var/log/messages (system-messages)

  • /var/log/parallelcluster/clustermgtd (clustermgtd)

  • /var/log/parallelcluster/computemgtd (computemgtd)

  • /var/log/parallelcluster/pcluster_dcv_authenticator.log (dcv-authenticator)

  • /var/log/parallelcluster/pcluster_dcv_connect.log (dcv-ext-authenticator)

  • /var/log/parallelcluster/slurm_resume.log (slurm_resume)

  • /var/log/parallelcluster/slurm_suspend.log (slurm_suspend)

  • /var/log/slurmctld.log (slurmctld)

  • /var/log/slurmd.log (slurmd)

  • /var/log/supervisord.log (supervisord)

  • /var/log/syslog (syslog)

使用的群集中的作业Amazon Batch存储达到的作业输出RUNNINGSUCCEEDED,或者FAILED省 CloudWatch 日志。日志组是/aws/batch/job,并且日志流名称格式为jobDefinitionName/default/ecs_task_id. 默认情况下,这些日志设置为永不过期,但您可以修改保留期。有关更多信息,请参阅 。更改中的日志数据留存 CloudWatch 日志中的亚马逊 CloudWatch Logs 用户指南.

亚马逊 CloudWatch 日志构建映像日志

为每个自定义构建映像创建一个具有名称的日志组/aws/imagebuilder/ParallelClusterImage-<image-id>. 具有名称的唯一日志流{pcluster er-version}/1 包含构建映像进程的输出。

你可以使用pcluster图像命令。有关更多信息,请参阅Amazon ParallelClusterAMI 自定义