日志记录 - Managed Service for Apache Flink
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Managed Service for Apache Flink 之前称为 Amazon Kinesis Data Analytics for Apache Flink。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

日志记录

日志记录对于生产应用程序了解错误和故障非常重要。但是,日志子系统需要收集日志条目并将其转发到日志中。虽然有些 CloudWatch 日志记录是可以的,但大量的日志记录可能会使服务过载并导致 Flink 应用程序落后。日志记录异常和警告当然是个好主意。但是,您无法为 Flink 应用程序处理的每条消息生成日志消息。Flink 针对高吞吐量和低延迟进行了优化,但日志记录子系统却没有。如果确实需要为每条已处理的消息生成日志输出,请在 Flink 应用程序中使用额外的 DataStream 日志和适当的接收器将数据发送到 Amazon S3 或 CloudWatch。请勿为此使用 Java 日志记录系统。此外,Managed Service for Apache Flink Debug Monitoring Log Level 设置会生成大量流量,这可能会造成反向压力。只有在积极调查应用程序问题时才应使用它。

使用日志见解查询 CloudWatch 日志

CloudWatch Logs Insights 是一项强大的服务,可以大规模查询日志。客户应利用其功能快速搜索日志,以识别和减少操作事件期间的错误。

以下查询在所有任务管理器日志中查找异常,并根据异常发生的时间对其进行排序。

fields @timestamp, @message | filter isPresent(throwableInformation.0) or isPresent(throwableInformation) or @message like /(Error|Exception)/ | sort @timestamp desc

有关其他有用的查询,请参阅示例查询