从警报启动 CloudWatch 调查
可以从警报,或从 CloudWatch 警报历史记录的过去两周内的任何时间点启动调查。
有关 CloudWatch 调查的更多信息,请参阅 CloudWatch 调查。
先决条件
从 CloudWatch 警报启动 CloudWatch 调查之前,必须为函数创建资源策略,以允许 CloudWatch 服务主体启动调查。要使用 Amazon CLI 执行此操作,请使用类似于以下示例的命令:
aws aiops put-investigation-group-policy \ --identifier arn:aws:aiops:us-east-1:111122223333:investigation-group/investigation_group_id \ --policy "{\"Version\":\"2008-10-17\",\"Statement\":[{\"Effect\":\"Allow\",\"Principal\":{\"Service\":\"aiops.alarms.cloudwatch.amazonaws.com\"},\"Action\":[\"aiops:CreateInvestigation\",\"aiops:CreateInvestigationEvent\"],\"Resource\":\"*\",\"Condition\":{\"StringEquals\":{\"aws:SourceAccount\":\"111122223333\"},\"ArnLike\":{\"aws:SourceArn\":\"arn:aws:cloudwatch:us-east-1:111122223333:alarm:*\"}}}]}" \ --region eu-north-1
将示例值替换为您的 Amazon 账户 ID、区域和调查组 ID。
从 CloudWatch 警报启动调查
通过 https://console.aws.amazon.com/cloudwatch/
打开 CloudWatch 控制台。 -
在左侧导航窗格中,依次选择警报和所有警报。
-
选择警报的名称。
-
在警报历史记录中选择要调查的时间段。
-
依次选择调查、启动新的调查。
-
在新调查标题中,输入调查的名称。然后选择开始调查。
CloudWatch 调查助手会启动并扫描您的遥测数据,查找可能与这种情况相关的数据。
-
在 CloudWatch 控制台的导航窗格中,选择调查,然后选择您刚刚启动的调查名称。
调查发现部分以自然语言显示警报状态及其触发原因的摘要。
-
(可选)在警报图表中,右键单击,然后选择深入查看警报或其监视的指标。
-
在屏幕右侧,选择建议选项卡。
随即显示 CloudWatch 调查发现的其他遥测数据清单,内含可能与调查有关的遥测数据。这些调查发现可能包括其他指标和 CloudWatch Logs Insights 查询结果。CloudWatch 调查根据警报运行了这些查询。
-
对于每个调查发现,选择添加到调查发现或放弃。
选择添加到调查发现后,遥测数据会添加到调查发现部分,CloudWatch 调查功能会使用此信息来指导其进一步的扫描和建议。
-
对于 CloudWatch Logs Insights 查询结果,要更改或编辑查询并重新运行,请打开结果的上下文(右键单击)菜单,然后选择在 Logs Insights 中打开。有关更多信息,请参阅使用 CloudWatch Logs Insights 分析日志数据。
要运行不同的查询,进入 Logs Insights 页面时,选择使用查询助手,就能够使用自然语言来形成查询。有关更多信息,请参阅使用自然语言生成和更新 CloudWatch Logs Insights 查询。
-
(可选)如果您知道另一项 Amazon 服务中的遥测数据可能适用于此调查,请转到该服务的控制台,将该遥测数据添加到此调查中。
-
-
CloudWatch 调查还可能将假设添加到建议选项卡的列表中。这些假设由调查得出,以自然语言显示。
对于每个假设,选择添加到调查发现或放弃。
-
您认为已经完成调查并找到了问题的根本原因时,请选择概述选项卡,然后选择调查摘要。然后,CloudWatch 调查会以自然语言汇总由调查得出的重要调查发现和假设。