使用Amazon X-Ray控制台 - Amazon X-Ray
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用Amazon X-Ray控制台

Amazon X-Ray会持续分析帐户中的跟踪数据,以确定应用程序中出现的紧急问题。当故障率超过预期范围,它会创建一个见解,记录问题并跟踪其影响,直到问题得到解决。通过洞察,您可以:

  • 确定应用程序中出现问题的位置、问题的根本原因以及相关影响。通过洞察提供的影响分析,您可以得出问题的严重性和优先级。

  • 随着时间的推移,问题发生变化时接收通知。洞察通知可以通过 Amazon EventBridge 与您的监控和警报解决方案集成。此集成使您能够根据问题的严重性自动发送电子邮件或警报。

X-Ray 控制台可识别服务地图中存在持续事件的节点。要查看见的汇总,请选择受影响的节点。您也可以通过选择见解左侧的导航窗格中。


      具有见解摘要的服务地图节点。

当 X-Ray 检测到异常在服务地图的一个或多个节点中。该服务使用统计建模来预测应用程序中服务的预期故障率。在前面的示例中,异常是Amazon Elastic Beanstalk。Elastic Beanstalk 服务器遇到多个 API 调用超时,导致下游节点出现异常。

在 X-Ray 控制台中启用见解

必须为要使用见解功能的每个组启用见解。您可以从Groups

  1. 打开X-Ray 控制

  2. 选择现有组或创建新组,方法是选择一个现有组创建组,然后选择启用见解。有关在 X-Ray 控制台中配置组的更多信息,请参阅在 X-Ray 控制台中配置组

  3. 在左侧的导航窗格中,选择见解,然后选择要查看的见解。

    
            X-Ray 控制台中的见解列表。
注意

X-Ray 使用探测总结、探测、探测和探测仪以及摄像测量仪从见解中检索数据的 API。要查看见解,请使用 Amazon XrayReadlyAccess IAM 托管策略或将以下自定义策略添加到您的 IAM 角色:

{ "Version": "2012-10-17", "Statement": [ { "Effect": "Allow", "Action": [ "xray:GetInsightSummaries", "xray:GetInsight", "xray:GetInsightEvents", "xray:GetInsightImpactGraph" ], "Resource": [ "*" ] } ] }

有关更多信息,请参阅 Amazon X-Ray 如何与 IAM 协同工作

启用见解通知

通过洞察通知,会为每个洞察事件创建通知,例如创建洞察、显著变化或关闭洞察时。客户可以通过 Amazon EventBridge 事件接收这些通知,并使用条件规则执行诸如 SNS 通知、Lambda 调用、向 SQS 队列发布消息或 EventBridge 支持的任何目标等操作。见解通知发出了最好的最佳-努力的基础上,但不能保证。有关目标的更多信息,请参阅Amazon EventBridge 目标

您可以从Groups页.

启用 X-Ray 组的通知

  1. 打开X-Ray 控制

  2. 选择现有组或创建新组,方法是选择一个现有组创建组,请确保启用见解,然后选择启用通知。有关在 X-Ray 控制台中配置组的更多信息,请参阅在 X-Ray 控制台中配置组

配置亚马逊 EventBridge 条件规则

  1. 打开Amazon EventBridge 控制台

  2. 导航到Rule,然后选择左侧导航栏中的创建规则

  3. 提供规则的名称和描述。

  4. 选择事件模式,然后选择自定义模式。提供包含"source": [ "aws.xray" ]"detail-type": [ "AWS X-Ray Insight Update" ]。以下是可能的模式的一些示例。

    • 与来自 X-Ray 洞察的所有传入事件匹配的事件模式:

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ] }
    • 匹配指定的事件模式statecategory

      { "source": [ "aws.xray" ], "detail-type": [ "AWS X-Ray Insight Update" ], "detail": { "State": [ "ACTIVE" ], "Category": [ "FAULT" ] } }
  5. 选择并配置当事件与此规则匹配时要调用的目标。

  6. (可选)提供标签,以便更轻松地识别和选择此规则。

  7. 选择创建

注意

X-Ray 洞察通知将事件发送到 Amazon EventBridge,该事件目前不支持客户管理的 CMK。有关更多信息,请参阅 Amazon X-Ray 中的数据保护

见解概述

了解见解的概述页面t来回答三个关键问题:

  • 什么是潜在问题?

  • 根本原因是什么?

  • 什么是影响?

这些区域有:异常服务部分显示了每个服务的时间表,该时间表说明事件发生期间故障率的变化。时间线显示在实体频段上覆盖故障的迹线数,根据记录的通信量指示预期的故障数量。洞察的持续时间通过事件窗口。当 X-Ray 观察到指标变得异常时,事件窗口将开始,并在洞察处于活动状态时持续存在。

以下示例显示了导致事件的故障数量增加:


        X-Ray 洞察的概述页面。

这些区域有:根本原因部分显示了一个侧重于根本原因服务和受影响路径的服务图。您可以通过选择根本原因映射右上角的眼睛图标来隐藏未受影响的节点。根本原因服务是 X-Ray 识别异常的最远下游节点。它可以表示您指定的服务,也可以表示服务使用分析客户端调用的外部服务。例如,如果您在调用 Amazon DynamoDB 时使用分析Amazon开发工具包客户端,来自 DynamoDB 的故障增加会导致深入了解 DynamoDB 的根本原因。

要深入了解根本原因,请选择查看根本原因详细信息在根本原因图上。可以使用分析页面调查根本原因和相关消息。有关更多信息,请参阅 与 Amazon X-Ray Analytics 控制台交互


        X-Ray 洞察的概述页面。

在地图中继续上游的故障可能会影响多个节点并导致多个异常。如果错误一直传递给发出请求的用户,则结果是客户端故障。这是服务映射根节点中的故障。这些区域有:Impact图形提供了整个组的客户端体验的时间线。此体验是根据以下状态的百分比计算的:故障错误Throttle, 和好的


        X-Ray 事件的撞击图。

此示例显示事件发生期间根节点有故障的跟踪数量增加。下游服务中的事件并不总是与客户端错误的增加相对应。

选择分析见解将在一个窗口中打开 X-Ray 分析控制台,您可以在该窗口中深入了解导致洞察的痕迹集。有关更多信息,请参阅 与 Amazon X-Ray Analytics 控制台交互

了解影响

Amazon X-Ray测量持续存在的问题所造成的影响,作为生成见解和通知的一部分。通过两种方式衡量影响:

  • X-Ray 影响Group

  • 对根本原因服务的影响。

这种影响取决于在给定时间段内失败或导致错误的请求的百分比。此影响分析允许您根据特定情况得出问题的严重性和优先级。此影响可作为控制台体验以及见解通知的一部分提供。

重复数据消除

Amazon X-Ray洞察可以跨多个微服务消除重复问题。它使用异常检测来确定作为问题根本原因服务的服务,确定其他相关服务是否由于相同的根本原因而出现异常行为,并将结果记录为单一见解。

查看洞察的进度

X-Ray 定期重新评估见解,直到它们得到解决,并将每个显著的中间变化记录为通知,它可以作为亚马逊 EventBridge 事件发送。这使您能够构建流程和工作流,以确定问题随时间变化的情况,并采取适当的操作,例如发送电子邮件或使用 EventBridge 与警报系统集成。

您可以在影响时间线检查页. 默认情况下,时间轴会显示受影响最大的服务,直到您选择其他服务为止。


        检查带有影响时间轴的页面。

要查看事件的服务地图和图形,请从影响时间轴中选择它。服务图显示应用程序中受事件影响的服务。UNER影响分析中,图形显示选定节点和组中客户端的故障时间线。


        X-Ray 洞察力的影响分析图。

要更深入地查看事件中涉及的痕迹,请选择分析事件检查页. 可以使用分析页面来细化跟踪列表并识别受影响的用户。有关更多信息,请参阅 与 Amazon X-Ray Analytics 控制台交互