AWS Systems Manager 中的日志记录和监控 - AWS Systems Manager
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

AWS Systems Manager 中的日志记录和监控

监控是保持 AWS Systems Manager 和您的 AWS 解决方案的可靠性、可用性和性能的重要方面。您应从 AWS 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。AWS 提供了多种工具来监控 Systems Manager 和其他资源并对潜在的事件做出响应。

AWS CloudTrail 日志

CloudTrail 提供了用户、角色或 AWS 服务在 Systems Manager 中所执行操作的记录。使用 CloudTrail 收集的信息,您可以确定向 Systems Manager 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。有关更多信息,请参阅 使用 AWS CloudTrail 记录 AWS Systems Manager API 调用

Amazon CloudWatch 警报

使用 Amazon CloudWatch 警报,您可以在为 Amazon Elastic Compute Cloud (Amazon EC2) 实例和其他资源指定的时间段内监控某个指标。如果指标超过给定阈值,则会向 Amazon Simple Notification Service (Amazon SNS) 主题或 AWS Auto Scaling 策略发送通知。CloudWatch 警报将不会调用操作,因为这些操作处于特定状态。而是必须在状态已改变并在指定的若干个时间段内保持不变后才调用。有关更多信息,请参阅 。使用 Amazon CloudWatch 警报中的Amazon CloudWatch 用户指南

Amazon CloudWatch 仪表板

CloudWatch 控制台是 CloudWatch 控制台中的可自定义主页,可用于在单个视图中监控您的资源,即便是分布到不同 AWS 区域的资源,也能对其进行监控。您可以使用 CloudWatch 控制面板创建 AWS 资源的指标和警报的自定义视图。有关更多信息,请参阅 由 Systems Manager 托管的亚马逊云监视仪表板

Amazon EventBridge

Amazon EventBridge 允许您配置规则来提醒您 Systems Manager 资源的变化,并指导 EventBridge 根据这些事件的内容执行操作。EventBridge 为由各种 Systems Manager 功能发出的许多事件提供支持。有关更多信息,请参阅 使用亚马逊 EventBridge 监控 Systems Manager 事件

Amazon CloudWatch Logs 和 SSM 代理日志

SSM 代理将有关执行、计划操作、错误和运行状况的信息写入每个实例上的日志文件。您可以通过手动连接到实例来查看日志文件。我们建议将代理日志数据自动发送到 CloudWatch 日志中的日志组以进行分析。有关更多信息,请参阅 将实例日志发送到 CloudWatch 代理查看 SSM 代理日志

AWS Systems Manager 合规性

您可以使用合规性(AWS Systems Manager 的功能)扫描托管实例队列,了解补丁合规性和配置不一致性。您可以从多个 AWS 账户和区域中收集并聚合数据,然后深入了解不合规的特定资源。默认情况下,合规性显示有关修补程序管理器中的当前合规性数据、AWS Systems Manager 的功能以及状态管理器中的关联(AWS Systems Manager 的功能)。有关更多信息,请参阅 AWS Systems Manager 合规性

AWS Systems Manager Explorer

Explorer 是 AWS Systems Manager 的一项功能,是一个可自定义的操作控制面板,用于报告有关 AWS 资源的信息。Explorer 显示您的 AWS 账户和不同区域的操作数据 (OpsData) 的聚合视图。在中,OpsData 包含有关 EC2 实例、补丁合规性详细信息和操作工作项 (OpsItems) 的元数据。Explorer 提供有关如何在业务单位或应用程序之间分配 OpsItems、它们随时间的变化趋势以及它们如何随类别变化的上下文。您可以在 Explorer 中对信息进行分组和筛选,以将重点放在与您相关的项目和需要采取措施的项目上。有关更多信息,请参阅 AWS Systems Manager 资源器

AWS Systems Manager OpsCenter

AWS Systems Manager 是 AWS Systems Manager 的功能,它提供了一个中 OpsCenter 位置,运营工程师和 IT 专业人员可在该位置查看、调查和解决与 AWS 资源相关的操作工作项 (OpsItems)。OpsCenter 跨服务聚合和标准化 OpsItems,同时提供有关每个 OpsItem、相关 OpsItems 和相关资源的上下文调查数据。OpsCenter 还提供 Automation(AWS Systems Manager 的一项功能)中的操作手册,让您可以快速解决问题。OpsCenter 与 Amazon EventBridge 集成。这意味着您可以创建 EventBridge 规则,此规则自动为将事件发布到 EventBridge 的任何 AWS 服务创建 OpsItems。有关更多信息,请参阅 AWS Systems Manager OpsCenter

Amazon Simple Notification Service

您可以配置 Amazon Simple Notification Service (Amazon SNS),以便发送有关使用运行命令或维护时段(AWS Systems Manager 的功能)发送的命令的状态的通知。Amazon SNS 协调并管理向订阅了 Amazon SNS 主题的客户端或终端节点发送和传输通知。您可以在命令更改为新状态或特定状态(例如失败超时)时接收通知。如果您将一条命令发送给多个实例,则可接收发送给特定实例的命令的每个副本的通知。有关更多信息,请参阅 使用 Amazon SNS 通知监控 Systems Manager 状态更改

AWS Trusted Advisor 和 Personal Health 控制

Trusted Advisor 凝聚了在为数十万 AWS 客户提供服务的过程中所获悉的最佳实践。Trusted Advisor 可检查您的 AWS 环境,然后在有可能节省开支、提高系统可用性和性能或帮助弥补安全漏洞时提供建议。所有 AWS 客户均有权访问五个 Trusted Advisor 检查。使用 AWS Support 业务或企业计划的客户可以查看所有可 Trusted Advisor 检查。有关更多信息,请参阅 通过系统经理托管的 Trusted Advisor 和 Pervisor 控制面板