AWS Systems Manager 中的日志记录和监控 - AWS Systems Manager
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS Systems Manager 中的日志记录和监控

监控是保持 Systems Manager 和您的 AWS 解决方案的可靠性、可用性和性能的重要方面。您应该从 AWS 解决方案的各个部分收集监控数据,以便您可以更轻松地调试多点故障(如果发生)。AWS 提供了多种工具来监控您的 Systems Manager 和其他资源并对潜在事件做出响应。

AWS CloudTrail 日志

CloudTrail 提供用户、角色或 AWS 服务在 Systems Manager 中执行的操作记录。通过使用 CloudTrail 收集的信息,您可以确定向 Systems Manager 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。有关更多信息,请参阅使用 AWS CloudTrail 记录 AWS Systems Manager API 调用

Amazon CloudWatch 警报

使用 Amazon CloudWatch 警报,您可以在为 EC2 实例和其他资源指定的时间段内监控某个指标。如果该指标超出指定阈值,则会向 Amazon SNS 主题或 AWS Auto Scaling 策略发送通知。CloudWatch 警报不会因为处于特定状态就调用操作,而是必须在状态已改变并在指定的若干个时间段内保持不变后才调用。有关更多信息,请参阅 中的Amazon CloudWatch使用 警报。Amazon CloudWatch 用户指南

Amazon CloudWatch 控制面板

CloudWatch 控制面板是 CloudWatch 控制台中的可自定义主页,可用于在一个视图中监控您的资源,即便是那些分布到不同区域的资源,也能对其进行监控。您可以使用 CloudWatch 控制面板创建 AWS 资源的指标和报警的自定义视图。Amazon CloudWatch 控制面板是 CloudWatch 控制台中的可自定义主页,可用于在一个视图中监控您的资源,即便是那些分布到不同区域的资源,也能对其进行监控。您可以使用 CloudWatch 控制面板创建 AWS 资源的指标和警报的自定义视图。有关更多信息,请参阅Systems Manager 托管的 Amazon CloudWatch 控制面板

Amazon EventBridge

EventBridge 让您可以配置规则来提醒您 Systems Manager 资源的改变,并指导 EventBridge 根据这些事件的内容执行操作。EventBridge 支持各种 Systems Manager 功能发出的很多事件。有关更多信息,请参阅使用 Amazon EventBridge 监控 Systems Manager 事件

Amazon CloudWatch Logs 和 SSM 代理 日志

SSM 代理将有关执行、计划操作、错误和运行状况的信息写入每个实例上的日志文件。您可以通过手动连接到实例来查看日志文件。我们建议将代理日志数据自动发送到 CloudWatch Logs 中的日志组以进行分析。有关更多信息,请参阅 将实例日志发送到 CloudWatch Logs (CloudWatch 代理)查看 SSM 代理 日志

AWS Systems Manager 配置合规性

您可以使用 AWS Systems Manager 配置合规性扫描托管实例队列,了解补丁合规性和配置不一致性。您可以从多个 AWS 账户和区域中收集并聚合数据,然后深入了解不合规的特定资源。默认情况下,配置合规性将显示有关 Systems Manager Patch Manager 修补和 Systems Manager 状态管理器 关联的当前合规性数据。有关更多信息,请参阅AWS Systems Manager 配置合规性

AWS Systems Manager Explorer

Explorer 是一个可自定义的操作控制面板,用于报告有关 AWS 资源的信息。Explorer 显示您的 AWS 账户和不同区域的操作数据 (OpsData) 的聚合视图。在 Explorer 中,OpsData 包含有关 EC2 实例、补丁合规性详细信息和操作工作项 (OpsItems) 的元数据。Explorer 提供有关如何在业务单位或应用程序之间分配 OpsItems、它们随时间的变化趋势以及它们如何随类别变化的上下文。您可以在 Explorer 中对信息进行分组和筛选,以将重点放在与您相关的项目和需要采取措施的项目上。有关更多信息,请参阅AWS Systems Manager Explorer

AWS Systems Manager OpsCenter

OpsCenter 提供了一个中心位置,运营工程师和 IT 专业人员可在该位置查看、调查和解决与 AWS 资源相关的操作工作项 (OpsItems)。OpsCenter 跨服务聚合和标准化 OpsItems,同时提供有关每个 OpsItem、相关 OpsItems 和相关资源的上下文调查数据。OpsCenter 还提供了您可用于快速解决问题的 Systems Manager Automation 文档。OpsCenter 与 Amazon EventBridge 集成。这意味着您可以创建 EventBridge 规则,此规则自动为将事件发布到 EventBridge 的任何 AWS 服务创建 OpsItems。有关更多信息,请参阅AWS Systems Manager OpsCenter

Amazon Simple Notification Service

您可以配置 Amazon Simple Notification Service (Amazon SNS) 来发送有关使用 Systems Manager Run Command 或 维护时段 发送的命令的状态的通知。Amazon SNS 协调并管理向订阅了 Amazon SNS 主题的客户端或终端节点发送和传输通知。您可以在命令更改为新状态或特定状态(例如失败超时)时接收通知。如果您将一条命令发送给多个实例,则可接收发送给特定实例的命令的每个副本的通知。有关更多信息,请参阅使用 Amazon SNS 通知监控 Systems Manager 状态更改

AWS Trusted Advisor 和 Personal Health Dashboard

Trusted Advisor 凝聚了从为数十万 AWS 客户提供服务中总结的最佳实践。Trusted Advisor 可检查您的 AWS 环境,然后​在有可能节省开支、提高系统可用性和性能或弥补安全漏洞时为您提供建议。所有 AWS 客户均有权访问五个 Trusted Advisor 检查。使用“商业”和“企业”支持计划的客户可以查看所有 Trusted Advisor 检查。有关更多信息,请参阅通过 Systems Manager 托管的 Trusted Advisor 和 Personal Health 控制面板。