在 OpsCenter 中使用 Incident Manager 事件 - Amazon Systems Manager
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

在 OpsCenter 中使用 Incident Manager 事件

本主题介绍了如何从现有的 OpsItem 创建 Amazon Incident Manager 事件。事件是指任何计划外的服务中断或质量下降。Incident Manager 是 Amazon Systems Manager 的一项功能,它提供了一个事件管理控制台,可帮助缓解影响您的 Amazon 托管应用程序的事件并从中恢复。

Incident Manager 可通知响应人员 Amazon 资源受到的影响、突出显示相关故障排除数据并提供协作工具帮助服务恢复正常运行,从而提高事件解决能力。为了实现缩短严重事件解决时间的主要目标,Incident Manager 自动执行响应计划,并允许上报给响应团队。有关更多信息,请参阅《Amazon Systems Manager Incident Manager 用户指南》。

在事件解决后,事件后分析将指导您确定事件响应的改进措施,并给出操作项建议,以解决调查结果。对于诸如事件等高严重性操作问题,在 OpsCenter 中创建 OpsItem 可以让操作人员全面了解事件,包括分析和操作项。OpsCenter 是 Systems Manager 的一项功能。全面了解这些方面的内容,可缩短解决问题的时间,并有助于缓解未来出现的类似问题。

工作原理

设置和配置 Incident Manager 后,系统将通过以下方式与 OpsCenter 集成:

  1. 在 Incident Manager 中创建事件后,系统会在 OpsCenter 中创建一个 OpsItem(如果 OpsItem 尚不存在)。该事件将作为相关项添加到 OpsItem。第一个 OpsItem 称为 OpsItem。您还可以从 OpsItem 手动创建事件。从 OpsItem 创建事件后,该 OpsItem 将提升为父 OpsItem。

    除了为标准 OpsItems 显示的 Overview (概览)Related resource details (相关资源详细信息) 选项卡之外,包含事件的 OpsItems 还有另外两个选项卡。包含事件的 OpsItems 在 Associated items (关联项) 选项卡上显示相关的事件、OpsItems、分析和操作项。Timeline (时间线) 选项卡显示相关事件的时间顺序历史记录和对父 OpsItem 的分析。

  2. 如果事件的规模和范围扩大,您可以向父级 OpsItem 添加其他事件。

  3. 事件关闭后,您可以在 Incident Manager 中创建事件分析。分析可帮助您确定改进流程,以便在将来缓解类似的问题。系统会根据分析自动更新 OpsCenter 中的事件。如果分析包含操作项,系统会在分析的基础上创建额外的 OpsItems。这些额外 OpsItems 的类型为操作项

开始前的准备工作

您必须在 Incident Manager 中设置和配置响应计划。响应计划定义了如何将事件上报给第一响应人员,以及响应人员应该采取哪些操作。有关更多信息,请参阅响应计划

为 OpsItem 创建事件

按照以下过程为 OpsItem 手动创建事件。

要为 OpsItem 手动创建事件,请执行以下步骤:

  1. 访问 https://console.aws.amazon.com/systems-manager/,打开 Amazon Systems Manager 控制台。

  2. 在导航窗格中,选择 OpsCenter

  3. 如果 Incident Manager 为您创建了 OpsItem,请选择它,然后转到步骤 5。如果没有,请选择 Create OpsItem (创建 OpsItem) 并填写表单。如果您没有看到该按钮,请选择 OpsItems 选项卡,然后选择 Create OpsItem (创建 OpsItem)

  4. 如果您创建了新的 OpsItem,则打开它。

  5. 选择 Start Incident (启动事件)

  6. 对于 Response plan (响应计划),选择要分配给此事件的 Incident Manager 响应计划。

  7. (可选)对于 Title (标题),输入一个有助于其他团队成员了解事件性质的描述性名称。如果您没有输入新的标题,OpsCenter 会使用响应计划中的标题在 Incident Manager 中创建 OpsItem 和相应的事件。

  8. (可选)对于 Incident impact (事件影响),选择该事件的影响级别。如果您没有选择影响级别,OpsCenter 会使用响应计划中的影响级别在 Incident Manager 中创建 OpsItem 和相应的事件。

  9. 选择开始