使用 CloudWatch Logs 监控 Amazon EKS 作业的 Amazon Batch - Amazon Batch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 CloudWatch Logs 监控 Amazon EKS 作业的 Amazon Batch

您可以使用 Amazon CloudWatch Logs 来监控、存储和查看所有日志文件。使用 CloudWatch Logs,您可以搜索、筛选和分析来自多个来源的日志数据。

您可以下载 Amazon 获取 Fluent Bit 映像,其中包含一个插件,用于监视 CloudWatch Logs 中 Amazon EKS 作业的 Amazon Batch。Fluent Bit 是一个开源的日志处理器和转发器,其与 Docker 和 Kubernetes 兼容。我们建议您使用 Fluent Bit 作为日志路由器,因为它的资源密集度低于 Fluentd。有关更多信息,请参阅为 Fluent Bit 映像使用 Amazon

先决条件

CloudWatchAgentServerPolicy 策略附加到 Worker 节点的 Amazon Identity and Access Management 策略。有关更多信息,请参阅先决条件

安装 Amazon 获取 Fluent Bit

有关如何安装 Amazon 获取 Fluent Bit 和创建 CloudWatch 群组的说明,请参阅设置 Fluent Bit CloudWatch 代理和 Fluent Bit 的快速入门

提示

请记住,Fluent Bit 在 Amazon Batch 节点上占用 5 CPU 和 100 MB 的内存。这会减少 Amazon Batch 作业的总可用容量。在确定工作规模时,请考虑这一点。

为 Amazon Batch 节点开启 Fluent Bit

要确保 Fluent Bit 日志 DaemonSet 在 Amazon Batch 托管节点上运行,请修改 Fluent Bit DaemonSet 的容忍度:

tolerations: - key: "batch.amazonaws.com/batch-node" operator: "Exists"