View a markdown version of this page

查看 CloudWatch RUM 控制面板 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

查看 CloudWatch RUM 控制面板

CloudWatch RUM 通过交互式控制面板从用户会话中收集和可视化应用程序性能数据。通过捕获加载时间、Apdex 分数、设备信息、地理位置和错误模式,团队可以快速识别性能瓶颈,根据实际用户影响确定修复的优先级,并确保在不同的浏览器、设备和地理区域获得最佳体验,从而帮助组织更好地了解用户行为,从而减少最终用户的挫败感并提高应用程序的可靠性。

开始使用 CloudWatch Logs

  1. 通过 https://console.aws.amazon.com/cloudwatch/ 打开 CloudWatch 控制台。

  2. 在导航窗格中,选择 Application Signals(APM)RUM

RUM 控制台显示概述页面,该页面提供了所有应用程序监视器、其运行状况和关键操作指标的综合视图。从“概述”页面选择应用程序监视器,以访问包含性能错误会话指标配置选项卡的详细视图。

概述

“概述”页面是 CloudWatch RUM 控制台的登录页面。它提供了所有应用程序监视器的高层级摘要,可帮助您快速评测受监控应用程序的运行状况、性能趋势和操作覆盖范围。

此 RUM 概述页面显示摘要卡、快速筛选器和“应用程序监视器”表

摘要卡

在“概述”页面的顶部,有四张摘要卡可让您一目了然地显示所有应用程序监视器的运行状况:

  • 需要关注(按运行状况划分)– 显示总数中有多少应用程序显示器需要关注,按严重计数和已降级计数细分。进度条表示需要关注的显示器比例。

  • 趋势恶化:显示总数中有多少应用程序显示器呈恶化趋势。

  • 设置和覆盖范围:显示有多少应用程序监视器未配置 SLO 以及有多少显示器已禁用跟踪,从而帮助您识别监控设置中的差距。

  • SLO 和警报:显示总数 SLI 中被破坏的 SLI 数量以及当前触发的警报数量。

快速筛选

左侧面板提供了快速筛选器,可通过以下方式缩小应用程序列表范围:

  • 平台:Web、iOS 或 Android。

  • 运行状况:正常、严重、性能下降或无数据。

  • SLI 状态:正常、不正常或无 SLO。

  • 跟踪:已启用或已禁用。

  • 趋势:恶化、改善或稳定。

  • 主要问题:按影响应用程序监视器的主要问题类型进行筛选。

选择清除筛选器,重置所有筛选器。

“应用程序监视器”表

应用程序监视器表列出了您的所有应用程序监视器,其中包含以下几列:

  • 名称:带有平台图标的应用程序监视器名称(Web、iOS 或 Android)。

  • 会话:选定时间范围内记录的会话数,以条形图可视化显示。

  • SLI 状态:服务级别指标的状态。显示不正常的 SLI 的计数(例如“1/2 Unhealthy”),如果未配置 SLO,则显示创建 SLO 链接。

  • 运行状况:应用程序的运行状态:正常严重性能下降无数据

  • 查看见解:选择此链接可打开应用程序监视器的诊断侧面板(请参阅诊断侧面板)。

  • 主要问题:影响应用程序的主要问题类型。对于 Web 应用程序监视器,值包括 JS errorsPerfHTTP errors/faults。对于移动应用程序监视器,值包括 CrashesANRs/App HangsPerfHTTP errors/faults

  • 趋势:对趋势方向和幅度的描述(例如,“JS errors +1% worse sessions”或“Perf +81% worse sessions”)。

  • 跟踪:如果启用跟踪,则为查看跟踪链接;如果未启用跟踪,则为启用跟踪链接。

  • 服务:关联服务的 SLI 运行状况状态(例如,“1/1 Unhealthy”),如果未关联任何服务,则使用短划线。

  • 上次收到的事件:自收到上次遥测事件以来的时间(例如,“1 minute ago”或“No events received in the past 4 weeks”)。

使用表格上方的搜索栏按名称查找特定的应用程序监视器。您可以通过单击列标题对表格进行排序,并使用齿轮图标来自定义哪些列是可见的。使用操作下拉列表和添加应用程序监视器按钮,您可以直接从此页面管理应用程序监视器。

运行状况

运行状况列根据所选时间范围内受影响的会话(出现错误或页面加载缓慢的会话)占总会话数的百分比,对每个应用程序的运行状态进行一目了然的评测。

每个应用程序监视器都显示以下状态之一:

Status 受影响的会话 说明
正常 低于 1% 应用程序在正常参数内运行。
性能下降 介于 1% 和 5% 之间 应用程序出现错误率升高或性能下降的问题,可能需要注意。
重大 高于 5% 应用程序出现重大错误或性能问题,需要立即进行调查。
无数据 可用数据不足,无法确定应用程序的运行状况。应用程序监视器未收到最近的遥测数据时,可能会发生这种情况。

诊断侧面板

当您在表格中为应用程序监视器选择查看见解时,将在页面右侧打开一个诊断侧面板。该面板显示应用程序监视器名称并提供两个选项卡:

此诊断侧面板显示“运行状况”选项卡,其中包含错误细分和指标图表

运行状况:使用颜色编码的指示器显示导致运行状况的错误明细 [例如 JS 错误、HTTP 错误(4xx)和 HTTP 错误(5xx)]。指标部分显示交互式时间序列图。单击图表中的某个点可查看关联会话。

对于 Web 应用程序监视器,将显示以下图表:

  • 页面浏览量:一段时间内的页面浏览次数。

  • 页面加载时间(p75):第 75 个百分位数的页面加载时间(以秒为单位)。

  • JS 错误:一段时间内 JavaScript 错误会话的计数。

  • HTTP 错误:一段时间内 HTTP 4xx 错误和 5xx 错误的计数。

对于移动应用程序监视器(Android 和 iOS),将显示以下图表:

  • 屏幕加载时间:屏幕加载时间随时间变化的时间。

  • 屏幕加载次数:一段时间内屏幕加载的次数。

  • 崩溃:一段时间内的崩溃会话数。

  • 应用程序挂起/ANR 数:一段时间内应用程序挂起(iOS)或 ANR(Android)会话的计数。

  • HTTP 错误:一段时间内 HTTP 4xx 错误和 5xx 错误的计数。

此诊断侧面板显示指标图表、违规的 SLO 和处于 ALARM 状态的警报

在指标下方,面板还显示:

  • 违规的 SLO:此表列出了所有处于违规状态的 SLO,以及可转到 SLO 详细信息的链接。

  • 处于 ALARM 状态的警报:此表列出了应用程序监视器当前触发的所有警报。

关联会话选项卡:显示与指标图表中选定数据点相关的会话。

Web 应用程序控制面板

如果选择 Web 应用程序监视器,将会看到以下选项卡:

  • 性能选项卡显示页面性能信息,包括加载时间、请求信息、Web 重要信息和一段时间内的页面加载次数。在此选项卡上,您还可以在页面加载资源位置之间切换视图,进而查看有关页面性能的更多详细信息。

    页面加载视图具有交互式 Web 重要信息图表,您可以在其中查看页面核心 Web 重要信息的不同百分位数值,并在图表上选择数据点以查看 CloudWatch RUM 捕获的关联会话。您可以在那里使用诊断表中的一个链接导航到“会话”选项卡,以确定导致性能问题的特定情况。该选项卡还包含应用程序性能指数(Apdex)分数,用于表示最终用户的满意度。分数范围为 0(最不满意)到 1(最满意)。分数仅基于应用程序性能。有关 Apdex 分数的更多信息,请参阅 CloudWatch RUM 如何设置 Apdex 分数。底部的表格根据页面 ID 列出了前 100 个页面加载时间。您可以在表格标题旁边的下拉列表中更改此属性。

    此“性能”选项卡显示“页面”加载视图,其中包含交互式 Web 重要信息图表、Apdex 分数和前 100 个页面加载时间表

    同样,资源视图可按资源类型显示资源请求时间和计数。位置视图提供交互式地图,可让您深入查看更精细的视图,并调查特定区域的性能问题。

    “性能”选项卡显示“资源”和“位置”视图

    右侧的诊断面板还有浏览器设备选项卡,其中显示了导致性能问题的前 5 个浏览器/设备。您可以单击条形图导航到“会话”选项卡,进一步调查问题。

    此诊断面板显示浏览器和设备选项卡,其中包含导致问题的前 5 个浏览器和设备
  • JS 错误选项卡在摘要组件中显示 JavaScript 错误计数和错误率,以及错误最多的浏览器和设备。此选项卡包含一个图表,显示出现 JS 错误的会话数量和失败率。您可以单击图表中的任何数据点,在诊断面板中查看关联的会话。底部的表格列出了前 100 个 JS 错误。表格中的错误计数链接可用于导航到会话选项卡,您可以在其中查看相关会话。

    此 JS 错误选项卡显示错误计数、故障率图表、诊断面板和前 100 个 JS 错误表
  • Http 请求选项卡在顶部的 HTTP 请求摘要中显示 HTTP 请求量和错误信息。此选项卡包含一个含 HTTP 错误、HTTP 错误和网络故障的图表。您可以单击图表中的任何数据点,在诊断面板中查看关联的会话。底部的表格列出了出现问题的前 100 条网络路由。如果您展开其中一行,就可以看到该 URL 最常见的错误消息。表格中的错误计数链接可用于导航到会话选项卡,您可以在其中查看相关会话。

    此 HTTP 请求选项卡显示请求摘要、错误图、诊断面板和前 100 个网络路由表
  • 会话选项卡将显示表格,其中按时间降序列出所有会话。底部瀑布可视化将显示所选会话的所有遥测数据,帮助您跟踪用户交互并识别性能问题。您可以单击错误列中的错误链接,筛选瀑布图中是否存在特定的错误事件。选择瀑布图中的任意一行,可以打开诊断面板,您可以在其中查看原始事件。

    此“会话”选项卡显示会话列表和遥测事件的瀑布可视化

    对于 HTTP 请求,您将看到链接到“跟踪数据”控制台的 HTTP 和 Xray 事件的 traceId。对于 JS 错误或 HTTP 错误事件之类的事件,诊断面板包括带有堆栈跟踪的异常选项卡。单击瀑布图中的查看按钮,可以快速访问此信息。

    此会话诊断面板显示 traceId 链接和带有堆栈跟踪的“异常”选项卡
  • User Journey(用户历程)选项卡显示客户用于导航应用程序的路径。您可以看到客户进入应用程序的位置以及从应用程序退出的页面。您还可以看到其所用的路径以及遵循这些路径的客户百分比。您可以在节点上暂停以获取有关该页面的更多详细信息。您可以选择单个路径来突出显示连接以便更轻松查看。默认情况下,该页面会显示直到第 2 次互动的用户旅程。您可以单击添加路径按钮,查看更多互动。

    此“用户旅程”选项卡显示带有“添加路径”按钮的导航路径
  • 指标选项卡将显示应用程序监视器发布的所有默认 CloudWatch 指标,包括性能 Web 重要信息、错误指标(JavaScript 错误、HTTP 错误/故障)、数量、用户流程和 Apdex 指标。如果您为应用程序创建了扩展指标,该选项卡还会在扩展指标部分包含这些指标的子集。该子集包括类型为 PageViewCount、PerformanceNavigationDuration、Http4xxCount、Http5xxCount 和 JsErrorCount 的指标。对于每种指标类型,控制面板会显示三个指标变体。由于这些是 CloudWatch 指标,您还可以使用添加到控制面板选项,将此选项卡导出到自己的控制面板,并对其进行更新以包含更多指标。

    此“指标”选项卡显示应用程序监视器发布的默认和扩展 CloudWatch 指标

(可选)您可以在前五个选项卡中的任何一个选项卡上,使用顶部的筛选栏根据用户 ID、会话 ID 和其他特定于事件的筛选器来筛选数据。您还可以使用左侧的快速筛选器面板对部分属性进行筛选,例如页面 ID、页面组、设备、浏览器、位置。这些筛选器可以使用保存筛选器选项进行保存,也可以使用筛选栏旁边的选择筛选器下拉列表重复使用。

包含快速筛选器面板、“保存筛选器”选项和“选择筛选器”下拉列表的筛选栏

移动应用程序控制面板

如果选择移动应用程序监视器,将会看到以下选项卡:

  • 性能选项卡可让您深入了解移动应用程序的性能,包括屏幕加载时间、应用程序启动时间(冷启动和热启动)、性能指标以及 Apdex 分数随时间变化的情况。详细视图按屏幕名称、操作系统版本、应用程序版本、设备和国家/地区,对性能进行了细分。单击图表中的屏幕加载时间、应用程序启动时间或位置数据点,将打开右侧的诊断面板,该面板会提供与数据点相关的更多见解,包括最新的相关会话,以及会话选项卡链接,以便进行问题排查。

    在此选项卡上,您还可以在屏幕加载应用程序启动位置视图之间切换,查看有关应用程序性能的更多详细信息。

    该选项卡还包含应用程序性能指数(Apdex)分数,用于表示最终用户的满意度。分数范围为 0(最不满意)到 1(最满意)。分数仅基于应用程序性能。有关 Apdex 分数的更多信息,请参阅 CloudWatch RUM 如何设置 Apdex 分数

    “移动性能”选项卡显示屏幕加载时间、应用程序启动时间和 Apdex 分数,并附有诊断面板
  • 错误选项卡将应用程序问题分为三类:网络错误、崩溃和 ANR(Android)/应用程序无响应(iOS)。网络错误选项卡包含折线图,用于显示网络延迟、客户端错误(4xx 状态代码)和服务器错误(5xx 状态代码)。单击图表中任何一条线条的数据点,将打开诊断面板。底部表格列出了 100 个最常见的网络路由。单击单选按钮将按所选网络路由筛选折线图。

    同样地,崩溃ANR/应用程序无响应选项卡将显示每个错误计数的折线系列,这些系列是可交互的。底部表格将显示最常见的顶部崩溃消息或 ANR/应用程序无响应堆栈跟踪。单击单选按钮将筛选图表,单击错误消息则将显示完整的堆栈跟踪。

    “移动错误”选项卡显示网络错误、崩溃和 ANR/应用程序挂起类别,并附有诊断面板
  • 会话选项卡将显示表格,其中按时间降序列出所有会话。底部瀑布可视化将显示所选会话的所有遥测数据,帮助您跟踪用户交互并识别性能问题。选择瀑布图中的任意一行,可以打开诊断面板。对于 HTTP 请求,您将看到链接到“跟踪”控制台的 traceId

    对于状态代码非 2xx、崩溃或 ANR(Android)/应用程序无响应(iOS)的 HTTP 请求,诊断面板包含带堆栈跟踪的异常选项卡。单击瀑布图中的查看按钮,可以快速访问此信息。

    “移动会话”选项卡显示瀑布可视化和包含 traceId 和“异常”选项卡的诊断面板
  • 指标选项卡将显示应用程序监视器发布的所有默认 CloudWatch 指标,包括性能指标(屏幕加载时间、应用程序冷启动时间)、错误指标(崩溃、ANR/应用程序无响应、HTTP 错误/故障)、数量和 Apdex 指标。如果您为应用程序创建了扩展指标,该选项卡还会在扩展指标部分包含这些指标的子集。该子集包括类型为 ScreenLoadTime、ScreenLoadCount、CrashCount、Http4xxCount、Http5xxCount、ANRCount/AppHangCount、ColdLaunchTime 和 WarmLaunchTime 的指标。对于每种指标类型,控制面板会显示三个指标变体。由于这些是 CloudWatch 指标,您还可以使用添加到控制面板选项,将此选项卡导出到自己的控制面板,并对其进行更新以包含更多指标。

  • 配置选项卡可以提供应用程序监视器常规设置和配置详细信息的访问权限。您还可以访问代码片段选项卡,其中包含使用 ADOT SDK 对移动应用程序进行埋点的说明,包括手动埋点和零代码埋点选项。

CloudWatch RUM 如何设置 Apdex 分数

应用程序性能索引 (Apdex) 是一种开放标准,其定义了报告、基准和评估应用程序响应时间的方法。Apdex 分数可帮助您了解和识别随时间推移对应用程序性能的影响。

Apdex 分数表示最终用户的满意度。分数范围为 0(最不满意)到 1(最满意)。分数仅基于应用程序性能。不要求用户对应用程序进行评级。

每个 Apdex 分数均属于三个阈值之一。根据 Apdex 阈值和实际应用程序响应时间,有三种性能,如下所示:

  • 满意:实际应用程序响应时间小于等于 Apdex 阈值。对于 CloudWatch RUM,此阈值为 2000 毫秒或更低。

  • 尚可:实际应用程序响应时间大于 Apdex 阈值,但小于或等于 Apdex 阈值的四倍。对于 CloudWatch RUM,此阈值为 2000 – 8000 毫秒。

  • 不满:实际应用程序响应时间大于 Apdex 阈值的四倍。对于 CloudWatch RUM,此阈值为大于 8000 毫秒。

使用以下公式计算 0-1 Apdex 总分数:

(positive scores + tolerable scores/2)/total scores * 100