为 CloudWatch 调查查看并执行建议的运行手册补救措施 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

为 CloudWatch 调查查看并执行建议的运行手册补救措施

当您向活动调查的区域添加假设时,CloudWatch 调查可能会显示显示建议的操作。一个建议的操作可能是查看文档,其中包含可帮助您手动修复问题的信息。

另一个建议可能是使用自动化运行手册尝试自动解决问题。自动化是 Systems Manager(另一项 Amazon Web Services 服务)中的一项功能。自动化运行手册定义了要在您选择的资源上运行的一系列步骤或操作。每个运行手册都旨在解决一个特定的问题。运行手册可以满足各种操作需求:创建、维修、重新配置、安装、故障排除、修复、复制等。有关自动化的更多信息,请参阅 与 Amazon Systems Manager Automation 集成

开始前的准备工作

在调查中使用自动化运行手册之前,请注意以下重要事项:

  • 选择执行运行手册会产生费用。有关更多信息,请参阅 Amazon Systems Manager 定价

  • 根本原因和运行手册建议由自动推理和生成式人工智能服务提供支持。

    重要

    您对执行运行手册步骤所产生的操作以及选择在运行手册执行期间输入的参数值负责。您可能需要编辑建议的运行手册,进而确保运行手册按预期运行。有关更多信息,请参阅《Amazon 负责任的 AI 政策

  • 根据运行手册的不同,您可能需要在运行手册的输入参数中输入值,然后才能运行执行。

  • 运行手册使用分配给操作员的 IAM 权限执行。如有必要,请使用不同的 IAM 权限登录,执行运行手册。除了正在执行的操作的权限外,您还需要其他 Systems Manager 权限才能执行运行手册步骤。有关更多信息,请参阅《Amazon Systems Manager 用户指南》中的设置自动化

审核并执行针对 CloudWatch 调查的建议运行手册操作
  1. 要查看有关建议运行手册的信息,请选择审核获取有关如何执行运行手册步骤的信息。

    在调查详细信息页面上,选择建议

  2. 建议窗格中,根据系统对所调查问题的分析,审核假设列表。

    对于每个假设,您可以选择以下选项:

    • 显示推理 – 查看有关系统为何生成假设的更多信息。

    • 查看操作 – 查看问题的建议操作。并非所有假设都将包括建议的操作。

    • 接受 – 接受假设并将其添加到调查的部分。

      注意

      接受假设并不会自动运行关联的运行手册解决方案。在接受假设之前,您可以查看建议的运行手册,但必须接受该假设才能执行运行手册。

    • 丢弃 – 拒绝假设,不再使用。

  3. 选择查看操作后,在建议的操作窗格中,查看为解决该问题可以采取的建议操作列表。建议的操作可能包括以下一项或多项:

    • Amazon 知识文章 – 提供有关手动解决问题可以采取的步骤的信息,以及指向更多信息的链接。

    • Amazon 文档 – 提供指向与问题相关的用户文档主题的链接。

    • Amazon 拥有的运行手册 – 列出一个或多个由 Amazon 管理的自动化运行手册,您可以运行这些运行手册来尝试解决问题。

    • 您拥有的运行手册 – 列出由您或您的账户或组织中的其他人创建的一个或多个自定义自动化运行手册,您可以运行这些运行手册来尝试解决问题。

      注意

      系统通过评估自定义运行手册中的关键字,然后将其与正在调查的问题相关的术语进行比较,自动生成此运行手册列表。

      更多的关键字匹配意味着特定的自定义运行手册在您拥有的运行手册列表中出现的位置更高。

  4. 审核假设后,您可以进一步检查建议的具体操作并通过选择了解更多阅读相关文档。您也可以选择审核详细信息来检查 Amazon 和您拥有的建议运行手册。

  5. 选择审核运行手册的详细信息时,请执行以下操作:

    1. 对于运行手册描述,请审核内容,其中概述了运行手册为修复正在调查的问题可以采取的措施。选择查看步骤,可视化运行手册的工作流程并深入了解各个步骤的详细信息。

    2. 对于输入参数,请为运行手册要求的任何参数指定值。这些参数因运行手册而异。

    3. 对于执行预览,请仔细审核信息。此信息说明了当您选择执行运行手册时的范围和影响。

      执行预览内容提供以下信息:

      • 运行手册操作将在多少个账户和区域中发生。

      • 将要采取的操作类型以及每种类型的数量。

        操作类型包括:

        • Mutating:运行手册步骤将通过创建、修改或删除资源的操作对目标进行更改。

        • Non-Mutating:运行手册步骤将检索有关资源的数据,但是不对其进行更改。此类别通常包括 DescribeListGet 和类似的只读 API 操作。

        • Undetermined:未确定的步骤将调用由另一个编排服务运行的执行,如 Amazon Lambda、Amazon Step Functions 或 Run Command(Amazon Systems Manager 的一项功能)。未确定的步骤可能还会调用第三方 API 或者运行 Python 或 PowerShell 脚本。Systems Manager Automation 无法检测到编排流程或第三方 API 执行的结果,所以无法对其进行评估。必须手动审查这些步骤的结果以确定其影响。

        有关支持的操作及其影响类型的信息,请参阅《Amazon Systems Manager 用户指南》中的运行手册操作的修复影响类型

    4. 请仔细查看预览信息,然后再决定是否继续。

      此时,您可以选择以下操作之一:

      • 停止,不要执行运行手册。

      • 在执行运行手册之前更改输入参数。

      • 使用您已经选择的选项执行运行手册。

    重要

    选择执行运行手册会产生费用。有关更多信息,请参阅 Amazon Systems Manager 定价

  6. 如果要执行运行手册,请选择执行

    如果您已经接受了该假设,则执行将运行。

    如果您尚未接受该假设,则在执行运行之前,会出现一个对话框提示您接受该假设。

为运行手册选择执行后,该操作将添加到调查的窗格中。通过调查,您可以监控调查发现中指标中的新数据,以查看运行手册操作是否正在纠正问题。