使用 Systems Manager 自动化修复 OpsItem 问题 - AWS Systems Manager
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用 Systems Manager 自动化修复 OpsItem 问题

AWS Systems Manager Automation 可帮助您快速修正中标识的 AWS 资源问题。Automation 使用预定义的 SSM Automation 文档(运行手册)来修正与 AWS 资源相关的常见问题。例如,Automation 包含运行手册来执行以下操作:

  • 停止、启动、重新启动和终止 Amazon Relational Database Service (Amazon RDS) 和 Amazon Elastic Compute Cloud (EC2) 实例。

  • 创建 AWS 资源,例如 Amazon 系统映像 (AMI)、Amazon Elastic Block Store (Amazon EBS) 快照和 Amazon DynamoDB 备份。

  • 配置资源以使用 AWS 服务,包括 Amazon EventBridge、AWS CloudTrail 和 Amazon Simple Storage Service (Amazon S3) 存储桶日志记录和版本控制。

  • 将 AWS Identity and Access Management (IAM) 实例配置文件附加到实例。

  • 解决 EC2 实例的 RDP 和 SSH 连接问题。

  • 重置 EC2 实例的访问权限。

AWS 管理控制台中的每个 OpsItem 都包含一个运行手册部分。

操作 OpsCenter 的自动化文档功能

以下列表描述了一些可用于帮助您运行 Automation 文档和修正问题的功能。

  • 当您选择生成 OpsItem 的 AWS 资源时,OpsCenter 会显示您可以在该资源上运行的自动化文档的列表。

  • 从列表中选择自动化文档时,OpsCenter 会预填充运行文档所需的某些字段。

  • OpsCenter 会保留为特定 OpsItem 运行的自动化文档的 30 天记录。

  • 状态和结果列中,您可以选择一个状态以查看有关该运行的重要详细信息,例如自动化失败的原因以及发生故障时正在运行的自动化文档的哪个步骤,如以下示例所示。

    
                            上次运行自动化文档时的状态信息。
  • 这些区域有:相关资源详细信息页面包含Run 自动化列表。通过该列表,您可以选择最近或资源特定的自动化文档,您可以运行这些文档来修复问题。此页面还包括有用的数据提供商,包括 Amazon CloudWatch 指标和警报、AWS CloudTrail 日志以及来自 AWS Config 的详细信息。

    
                            您可以运行的可用自动化文档的列表以及 “相关资源” 选项卡上的可用度量。
  • 您可以查看有关 Automation 文档的信息,方法是在控制台中选择文档名称或使用Systems Manager Automation 运行手册参考

使用运行手册可修正 OOpsItem ce 问题

在从 OpsItem 运行 Systems Manager Automation 文档 (运行手册) 时,您可以运行简单版本或者您可以选择高级配置选项。这些区域有:高级配置在 Systems Manager Automation 中打开运行手册,这将提供多个用于运行运行手册的选项。


                    一个 OpsCenter 运行手册,用于使用 “高级配置” 并在 Systems Manager 自动化中打开

以下过程介绍了如何运行简单版本的运行手册。有关运行高级配置Runbook,请参阅使用 Automation

开始前的准备工作

在运行 Automation 文档(运行手册)以修正 OpsItem 问题之前,请先执行以下操作:

  • 验证您是否拥有权限以运行 Systems Manager Automation 文档。有关更多信息,请参阅 设置 Automation

  • 收集要运行的自动化的资源特定的 ID 信息。例如,如果您要运行重新启动 EC2 实例的 Automation,则必须指定要重新启动的实例的 ID。

运行自动化文档(运行簿)以修正 OpsItem 问题

  1. AWS Systems Manager 控制台https://console.aws.amazon.com/systems-manager/

  2. 在导航窗格中,选择OpsCenter

  3. 选择 OpsItem ce ID 以打开详细信息页面。

    
                            OpsCenter OpsItem enter “概述” 页面上的新 OpsIce
  4. 滚动到 Runbooks (运行手册) 部分。

  5. 使用运行手册搜索栏或右上角的数字查找要运行的 Automation 文档。

  6. 选择运行手册,然后选择 Execute (执行)

  7. 输入运行手册的所需信息,然后选择 Execute (执行)

  8. 在导航窗格中,选择 Automation (自动化),然后选择 Execution ID (执行 ID) 链接以查看执行的步骤和状态。

使用关联运行手册

在从 OpsItem 运行 Automation 文档(运行手册)后,运行手册将自动与该 OpsItem 的相关资源关联以供将来参考。关联的运行手册的排名高于运行手册列表。

使用以下过程可运行已与 OpsItem 中的相关资源关联的 Automation 文档(运行手册)。有关添加相关资源的信息,请参阅使用 OOpsItems

运行与资源关联的运行手册以修正 OOpsItem 问题

  1. AWS Systems Manager 控制台https://console.aws.amazon.com/systems-manager/

  2. 在导航窗格中,选择OpsCenter

  3. 打开 OpsItem。

  4. 相关资源部分中,选择要在其中运行 Automation 文档(运行手册)的资源。

  5. 选择Run 自动化,然后选择要运行的相关 Automation 文档。

  6. 输入运行手册的所需信息,然后选择 Execute (执行)

  7. 在导航窗格中,选择 Automation (自动化),然后选择 Execution ID (执行 ID) 链接以查看执行的步骤和状态。