使用 Systems Manager 自动化修正 OpsItem 问题 - Amazon Systems Manager
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

使用 Systems Manager 自动化修正 OpsItem 问题

Amazon Systems Manager 自动化可帮助您快速修正在 OpsItems 中发现的 Amazon 资源问题。自动化使用预定义的 SSM 自动化运行手册来修正与 Amazon 资源相关的常见问题。例如,自动化包含运行手册来执行以下操作:

  • 停止、启动、重新启动和终止 Amazon Relational Database Service (Amazon RDS) 及 Amazon Elastic Compute Cloud (Amazon EC2) 实例。

  • 创建 Amazon 资源,例如 Amazon Machine Images (AMIs)、Amazon Elastic Block Store (Amazon EBS) 快照和 Amazon DynamoDB 备份。

  • 配置一个资源以使用 Amazon Web Services,包括 Amazon EventBridge、Amazon CloudTrail 和 Amazon Simple Storage Service(Amazon S3)存储桶日志记录和版本控制。

  • 将一个 Amazon Identity and Access Management (IAM) 实例配置文件附加到实例。

  • 排查 Amazon EC2 实例的 RDP 和 SSH 连接问题。

  • 重置 Amazon EC2 实例的访问权限。

Amazon Web Services Management Console中的每个 OpsItem 都包括 Runbooks (运行手册) 部分。

OpsCenter 中的自动化运行手册功能

以下列表介绍了一些可用的功能,可帮助您运行自动化运行手册并修正问题。

  • 当您选择生成 OpsItem 的 Amazon 资源时,OpsCenter 会显示您可以在该资源上运行的自动化运行手册列表。

  • 从列表中选择自动化运行手册时,OpsCenter 会预填充运行文档所需的一些字段。

  • OpsCenter 保留针对特定 OpsItem 运行自动化运行手册的 30 天记录。

  • Status and results (状态和结果) 列中,您可以选择一个状态来查看有关运行的重要详细信息,例如自动化失败的原因,以及失败发生时正在运行自动化运行手册的哪个步骤,如以下示例所示。

    
                            上次运行自动化运行手册的状态信息。
  • 所选 OpsItem 的 Related resource details (相关资源详细信息) 页面包含 Run automation (运行自动化) 列表。借助该列表,您可以选择最近的或特定于资源的自动化运行手册,并且可以运行这些运行手册来修正问题。此页面还包含有用的数据提供程序,其中包括 Amazon CloudWatch 指标和告警、Amazon CloudTrail 日志以及 Amazon Config 的详细信息(仅举几例)。

    
                            Related resources (相关资源) 选项卡上提供的可运行的可用自动化运行手册以及指标的列表。
  • 您可以通过在控制台中选择自动化运行手册名称或使用 Systems Manager 自动化运行手册参考 来查看有关该运行手册的信息。

使用运行手册可修正 OpsItem 问题

在从 OpsItem 运行 Systems Manager 自动化运行手册时,您可以运行简单版本,也可以选择 Advanced configuration (高级配置) 选项。如果选择 Advanced configuration (高级配置),将在 Systems Manager 自动化中打开运行手册,这将提供多个用于运行运行手册的选项。


                    一个 OpsCenter 运行手册,该运行手册使用 Advanced configuration (高级配置) 并在 Systems Manager 自动化中打开

以下过程介绍了如何运行简单版本的运行手册。有关运行使用 Advanced configuration (高级配置) 的运行手册的信息,请参阅 使用自动化

开始前的准备工作

在运行自动化文档(运行手册)以修正 OpsItem 问题之前,请执行以下操作:

  • 确认您有权运行 Systems Manager 自动化运行手册。有关更多信息,请参阅 设置自动化

  • 为要运行的自动化运行手册收集特定于资源的 ID 信息。例如,如果您要运行重新启动 EC2 实例的自动化运行手册,则必须指定要重新启动的实例的 ID。

要运行自动化运行手册来修正 OpsItem 问题,请执行以下步骤:

  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 Amazon Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 选择 OpsItem ID 以打开详细信息页面。

    
                            OpsCenter 概览页面上新增一个 OpsItem
  4. 滚动到 Runbooks (运行手册) 部分。

  5. 使用运行手册搜索栏或右上角的数字查找要运行的自动化运行手册。

  6. 选择运行手册,然后选择 Execute (执行)

  7. 输入运行手册的所需信息,然后选择 Execute (执行)

  8. 在导航窗格中,选择 Automation(自动化),然后选择 Execution ID(执行 ID)链接以查看执行的步骤和状态。

使用关联运行手册

在从 OpsItem 运行自动化运行手册后,运行手册将自动与该 OpsItem 的相关资源关联以供将来参考。关联的运行手册在 Runbooks (运行手册) 列表中的排名高于其他运行手册。

按照以下过程运行已与 OpsItem 中的相关资源关联的自动化运行手册。有关添加相关资源的信息,请参阅 使用 OpsItems

要运行与资源关联的运行手册以修正 OpsItem 问题,请执行以下步骤:

  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 Amazon Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 打开 OpsItem。

  4. Related resources (相关资源) 部分中,选择要运行自动化运行手册的资源。

  5. 选择 Run automation (运行自动化),然后选择要运行的关联自动化运行手册。

  6. 输入运行手册的所需信息,然后选择 Execute (执行)

  7. 在导航窗格中,选择 Automation(自动化),然后选择 Execution ID(执行 ID)链接以查看执行的步骤和状态。