监控 Amazon Kinesis Data Analytics for SQL 应用程序 - Amazon Kinesis Data Analytics for SQL 应用程序开发人员指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

监控 Amazon Kinesis Data Analytics for SQL 应用程序

要保持 Amazon Kinesis Data Analytics 和 Amazon Kinesis Data Analytics 应用程序的可靠性、可用性和性能,监控是一个重要环节。您应从 AWS 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。不过,在开始监控 Amazon Kinesis Data Analytics; 之前,您应制定一个监控计划并在计划中回答下列问题:

  • 您的监控目标是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

下一步是,在不同时间和不同负载条件下测量性能以在您的环境中设置正常 Amazon Kinesis Data Analytics 性能基准。在监控 Amazon Kinesis Data Analytics 时,您可以存储历史监控数据。如果您这样做,则可以将历史监控数据与当前性能数据进行比较,确定性能的正常模式和性能异常,并找出解决问题的方法。

通过使用 Amazon Kinesis Data Analytics,您可以监控应用程序。应用程序处理数据流(输入或输出),两者包含可用于缩小 CloudWatch 日志上的搜索范围的标识符。有关 Amazon Kinesis Data Analytics 如何处理数据流的信息,请参阅适用于 SQL 应用程序的 Amazon Kinesis Data Analytics :工作方式

最重要的指标是 millisBehindLatest,表示应用程序读取流式传输源的滞后程度。通常情况下,滞后时间应当为零或接近零毫秒。通常会出现短暂峰值,millisBehindLatest 中会出现增长。

我们建议您设置一个 CloudWatch 警报,以便在应用程序读取流式传输源的滞后时间超过 1 小时时触发该警报。对于某些几乎要求实时处理的使用情况(例如,将已处理的数据发送到实时应用程序),您可以选择将警报设置为更低值,如 5 分钟。