监控 AWS Systems Manager - AWS Systems Manager
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 AWS Systems Manager

监控是保持 Systems Manager 和您的 AWS 解决方案的可靠性、可用性和性能的重要方面。您应从 AWS 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。在开始监控 Systems Manager 之前,您应创建一个监控计划,解决以下问题:

  • 您的监控目标是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

在定义监控目标并创建监控计划后,下一步是在您的环境中建立正常 Systems Manager 性能的基准。您应该在不同时间和不同负载条件下测量 Systems Manager 的性能。监控 Systems Manager 时,您应存储所收集的监控数据的历史记录。您可将当前 Systems Manager 性能与这些历史数据进行比较,这样可帮助您确定性能的正常模式和异常模式,找出解决问题的方法。

例如,您可以监控 Automation 工作流程、补丁基准的应用、维护时段事件和配置合规性等操作的成功或失败。

还可以监控托管实例的 CPU 利用率、磁盘 I/O 和网络利用率。如果性能低于您所建立的基准,则您可能需要重新配置或优化实例以降低 CPU 使用率、改进磁盘 I/O 或减少网络流量。有关监控 EC2 实例的更多信息,请参阅 Amazon EC2 中的监控 Amazon EC2 用户指南(适用于 Linux 实例)

监控工具

本章的内容提供了有关使用可用于监控 Systems Manager 和其他 AWS 资源的工具的信息。有关工具的完整列表,请参阅 中的日志记录和监控AWS Systems Manager