在 Amazon CloudWatch 网络监测仪(Overview 选项卡)中跟踪实时性能和可用性 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

在 Amazon CloudWatch 网络监测仪(Overview 选项卡)中跟踪实时性能和可用性

使用 CloudWatch 控制台中 Internet Monitor 下的概述选项卡,大致了解监测仪所跟踪流量的性能和可用性。此选项卡还显示了互联网流量概览图,其中包含流量集群,可帮助您可视化应用程序的全球流量以及运行状况事件的发生位置和影响。

运行状况分数

运行状况分数图显示了全球流量的性能和可用性信息。对于不同 ASN 和 Amazon 服务的地理位置之间的网络流量,Amazon 拥有大量关于互联网性能和可用性的历史数据。网络监测仪使用 Amazon 从其全球网络足迹中捕获的连接数据来计算互联网流量的性能和可用性基准。这与我们在 Amazon 用来监控我们自己的互联网正常运行时间和可用性的数据相同。

以这些测量值为基准,Internet Monitor 可以检测到应用程序的互联网性能和可用性与基准相比何时有所下降。为了更容易看到下降情况,我们以性能分数和可用性分数的形式向您报告此信息。有关更多信息,请参阅使用 CloudWatch 工具和网络监测仪查询接口探索您的数据

运行状况分数图包括您选择的时间范围内发生的运行状况事件。发生运行状况事件时,您会看到图表上的性能或可用性线下降。如果您选择该事件,则图表上会显示更多详细信息和频段,其中日期和时间信息显示该事件持续了多长时间。

您也可以通过直接访问每个数据点的日志文件来查看这些指标。在 Actions(操作)菜单中,选择 View CloudWatch Logs(查看 CloudWatch 日志)。

互联网流量概览

互联网流量概览图显示了您的用户访问应用程序所在位置和 ASN 特有的互联网流量和运行状况事件。图上显示为灰色的国家/地区是包含应用程序流量的国家/地区。

图上的每个圆圈都表示在您选择的时间段内某个区域发生的运行状况事件。检测 Amazon 中托管的资源之一与用户正在用于访问应用程序的城市-网络之间出现连接问题(即达到某个特定阈值)时,网络监测仪会创建运行状况事件。在图上选择一个圆圈会显示有关该位置发生的运行状况事件的更多详细信息。此外,对于出现运行状况事件的集群,您可以在此图下方的 Health events(运行状况事件)表中查看详细信息。

请注意,在确定某个事件对您的应用程序具有重大全局影响时,网络监测仪会在监测仪中创建运行状况事件。如果在您选择的时间段内,没有任何运行状况事件对客户端位置的流量造成超阈值的影响,则此图为空白。有关更多信息,请参阅网络监测仪何时会创建和解决运行状况事件

更改运行状况事件阈值

您可以围绕网络监测仪为应用程序创建运行状况事件的方式和时间配置多个选项。选择更新阈值进行更改。

您可以更改将会触发网络监测仪创建运行状况事件的总体阈值。默认的运行状况事件性能和可用性阈值均为 95%。也就是说,当应用程序的总体性能或可用性分数降至 95% 或以下时,网络监测仪会创建运行状况事件。对于总体阈值,运行状况事件可以由单个较大的问题触发,也可以由多个较小的问题组合触发。

您还可以更改本地(即城市网络)阈值,该阈值如果与总体影响级别的百分比结合起来,将触发运行状况事件。例如,通过设置一个阈值,使其在一个或多个城市网络(地点和 ASN,通常是 ISP)的分数降至阈值以下时创建运行状况健康事件,您可以深入了解流量较低的地点何时出现问题。

一个额外的本地阈值选项可与本地阈值配合使用,用于可用性或性能分数。第二个因素是在网络监测仪根据本地阈值创建运行状况事件之前必然受到影响的流量占整体流量的百分比。

通过为整体流量和本地流量配置阈值选项,您可以微调创建运行状况事件的频率,以符合您的应用程序使用量和需求。请注意,如果您将本地阈值设置得较低,通常会创建较多的运行状况事件,具体取决于您的应用程序和您设置的其他阈值配置值。

总之,您可以通过以下方式为性能分数、可用性分数或两者配置运行状况事件阈值:

  • 为触发运行状况事件选择不同的全局阈值。

  • 为触发运行状况事件选择不同的本地阈值。使用此选项,您还可以更改网络监测仪创建事件之前必须超过的对整个应用程序的影响百分比。

  • 选择关闭基于本地阈值触发运行状况事件,或启用本地阈值选项。

您还可以配置有关性能分数、可用性分数或两者的选项。您可以配置这些选项的组合,也可以只配置其中一个。

要更新性能分数和/或可用性分数的阈值和其他配置选项,请执行以下操作:

更改阈值配置选项
  1. 在Amazon Web Services Management Console中,导航到 CloudWatch,然后在左侧导航窗格中选择“网络监测仪”。

  2. 概述选项卡的运行状况事件时间线部分中,选择更新阈值

  3. 在打开的对话框页面上,为触发网络监测仪创建运行状况事件的阈值和其他选项选择所需的新值和选项。您可以执行以下任意操作:

    • 可用性分数阈值性能分数阈值,或同时为两者选择一个新值。

      每个设置部分中的图表将显示应用程序可用性或性能的当前阈值设置和最近的实际运行状况事件分数。通过查看典型值,您可以了解可能需要将阈值更改为哪些值。

      提示:要查看大图并更改时间范围,请选择图表右上角的展开标志。

    • 选择开启或关闭有关可用性阈值或性能或两者的本地阈值。启用某个选项后,可以设置希望网络监测仪创建运行状况事件时的阈值和影响级别。

  4. 配置阈值选项后,选择更新运行状况事件阈值以保存更新。

要详细了解运行状况事件的工作原理,请参阅网络监测仪何时会创建和解决运行状况事件

运行状况事件表

运行状况事件表列出了受运行状况事件影响的客户端位置以及事件相关信息。表中包含以下列。

描述
客户端位置

受事件影响、延迟增加或可用性降低的最终用户的位置。

要详细了解网络监测仪中的客户端位置准确性,请参阅 网络监测仪中的地理位置信息和准确性

流量影响

该事件在延迟增加或可用性降低方面造成了多大影响。对于延迟,这是与使用此客户端网络从该客户端位置到该 Amazon 位置的流量的典型性能相比,事件期间延迟增加的百分比。

客户端网络

流量经过的网络。通常是网络流量的互联网服务提供商(ISP)或自治系统号(ASN)。

Amazon 位置

网络流量的 Amazon 位置,可以是 Amazon Web Services 区域 或互联网边缘站点。

影响类型

运行状况事件的影响类型。运行状况事件通常由延迟增加(性能问题)或可到达性(可用性问题)引起。

您也可以单击影响类型来查看损害的原因。网络监测仪会尽量分析运行状况事件的起源,以确定该事件是由 Amazon 还是 ASN(互联网服务提供商)引起的。

请注意,在事件解决后将继续此分析。Internet Monitor 可以在长达一个小时的时间内使用新信息更新事件。

如果您选择运行状况事件表中的客户端位置之一,则可以查看该位置的运行状况事件的更多详细信息。例如,您可以查看该事件何时开始、何时结束以及对本地流量的影响。

网络路径可视化

已完成的损伤分析在网络路径可视化下有一个完整的网络路径。对于此客户端/位置对,该完整路径将显示应用程序在 Amazon 位置和客户端位置之间的运行状况事件网络路径上的每个节点。

如果网络监测仪确定了受损的原因,则会用红色虚线圆圈标记。受损可能是由 ASN [通常是互联网服务提供商(ISP)] 造成的,或者原因可能是 Amazon。如果有多种原因造成受损,则系统会圈出多个节点。