本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
与 Amazon CloudWatch Logs 集成
有关 CloudWatch Logs 的更多信息,请参阅 Amazon CloudWatch Logs 用户指南。要配置 CloudWatch Logs 集成,请参阅 Monitoring 部分。要了解如何使用 append-config
将自定义日志附加到 CloudWatch 配置,请参阅 Amazon CloudWatch 用户指南 中的多个 CloudWatch 代理配置文件。
Amazon CloudWatch Logs 集群日志
将为每个集群创建一个名为 /aws/parallelcluster/
的日志组(例如 cluster-name-<timestamp>
/aws/parallelcluster/testCluster-202202050215
)。每个节点上的每个日志(如果路径包含 *
,则为一组日志)都有一个名为
的日志流。(例如 {hostname}
.{instance_id}
.{logIdentifier}
ip-172-31-10-46.i-02587cf29cc3048f3.nodewatcher
。) 日志数据由 CloudWatch 代理发送到 CloudWatch,该代理以 root
身份在所有集群实例上运行。
创建集群时会创建 Amazon CloudWatch 控制面板。通过此控制面板,可以查看存储在 CloudWatch Logs 中的日志。有关更多信息,请参阅 亚马逊 CloudWatch 控制面板。
下面的列表包含适用于平台、调度器和节点的日志流的 logIdentifier
和路径。
适用于平台、调度器和节点的日志流 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
平台 | 调度器 | 节点 | 日志流 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
amazon centos redhat ubuntu |
awsbatch slurm |
HeadNode |
dcv-authenticator: dcv-ext-authenticator: dcv-agent: dcv-xsession: dcv-server: dcv-session-launcher: Xdcv: cfn-init: chef-client: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
amazon centos redhat ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
cloud-init: supervisord: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
amazon centos redhat ubuntu |
slurm |
ComputeFleet |
cloud-init-output: computemgtd: slurmd: slurm_prolog_epilog: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
amazon centos redhat ubuntu |
slurm |
HeadNode |
sssd: sssd_domain_default: pam_ssh_key_generator: clusterstatusmgtd: clustermgtd: compute_console_output: slurm_resume: slurm_suspend: slurmctld: slurm_fleet_status_manager: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
amazon centos redhat |
awsbatch slurm |
ComputeFleet HeadNode |
system-messages: |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
ubuntu |
awsbatch slurm |
ComputeFleet HeadNode |
syslog: |
集群中使用 Amazon Batch 的作业会将进入 RUNNING
、SUCCEEDED
或 FAILED
状态的作业的输出存储在 CloudWatch Logs 中。日志组为 /aws/batch/job
,日志流名称格式为
。默认情况下,这些日志设置为不过期,但您可以修改保留期。有关更多信息,请参阅 Amazon CloudWatch Logs 用户指南 中的更改 CloudWatch Logs 中的日志数据留存。jobDefinitionName
/default/ecs_task_id
Amazon CloudWatch Logs 构建映像日志
将为每个自定义构建映像创建名为 /aws/imagebuilder/ParallelClusterImage-
的日志组。名为 <image-id>
{pcluster-version}
/1 的唯一日志流包含构建映像过程的输出。
您可以使用 pcluster 映像命令访问这些日志。有关更多信息,请参阅 Amazon ParallelCluster AMI 自定义。