Network Flow Monitor 的组件和功能 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Network Flow Monitor 的组件和功能

Network Flow Monitor 使用或引用了以下概念。

座席

Network Flow Monitor 中的代理指您在 Amazon EC2 实例资源上安装的软件应用程序。该应用程序具有两个部分:

  • 第一部分接收与 TCP 连接相关的事件,并使用 eBPF 在 Linux 内核中注册。eBPF 是 Linux 扩展 Berkley 数据包过滤器(eBPF)功能,指定程序可以通过其接收 Linux 内核引发的某些事件。

  • 第二部分汇总了 eBPF 部分收集的统计数据。代理大约每 30 秒向 Network Flow Monitor 后端发送一次聚合指标,可能有 5 秒钟的抖动(换言之,为 25 到 35 秒)。

有关代理的更多信息,请参阅工作方式

排名靠前的贡献者

排名靠前的贡献者指在 Network Flow Monitor 范围内或在监测仪中跟踪的网络流中,特定指标(例如重新传输)值最高的网络流。查看具有最高报告数量的流,以进行绩效指标衡量,此举可以帮助您了解可能存在哪些需要调查的损坏。Network Flow Monitor 将返回监控范围内排名靠前的贡献者的性能指标,以获取工作负载见解。此外,如果您创建监测仪,则 Network Flow Monitor 会针对监测仪所选的网络流,返回排名靠前的贡献者的性能指标。

本地和远程资源

本地资源指在工作负载的双向流中用于安装代理的主机。例如,如果工作负载由 Web 服务和后端数据库(例如:Amazon RDS)之间的交互组成,则托管 Web 服务的 EC2 实例即为本地资源,并且该实例还运行代理。本地资源可以是子网、VPC 或可用区。本地资源至少由 IP 地址和传输协议端口标识。

远程资源指工作负载双向流中的另一个端点。在此带有后端 RDS 数据库的 Web 服务示例中,Amazon RDS 是远程资源。远程资源可以是子网、VPC、可用区或 Amazon 服务。就像本地资源一样,远程资源由端点的 IP 地址和传输协议端口标识。

工作负载见解

工作负载见解包括范围内的所有网络流返回的性能指标。在 Amazon Web Services Management Console中,工作负载见解页面提供了有关已在工作负载实例上安装了 Network Flow Monitor 代理的工作负载的性能数据。工作负载见解页面提供应用程序视图,其中包括已传输的数据量和其他多个指标,按工作负载类别分组。例如,您可以查看可用区(AZ)之间或可用区内工作负载和流量的所有指标。通过使用这些见解,您可以选择要为其创建监测仪的工作负载,以查看更多详细信息并持续跟踪网络性能。

监视器

您可以创建监测仪,以便持续监控一个或多个特定工作负载的网络性能,并查看有关网络流的更多详细信息。对于每台监测仪,Network Flow Monitor 都会发布端到端性能指标和网络运行状况指标(NHI),以便帮助您确定损坏的归因。我们建议您查看工作负载页面上的信息,了解要重点关注哪些网络流,然后为这些流量创建监测仪。然后,通过定期查看工作负载见解,您可以决定是否拥有所需的监测仪,或者决定创建新监测仪是否会有所帮助。

网络运行状况指标(HNI)

网络运行状况指标(HNI)是二进制值,用于告知您在选择的时间段内,监测仪跟踪的一个或多个网络流是否存在 Amazon 网络问题。当 NHI 值为 1 或显示已降级时,则表明至少一个网络流存在 Amazon 网络问题。使用 NHI 指标,您可以快速决定是否应关注 Amazon 网络问题的故障排除工作还是关注工作负载引起的网络问题。

有关代理的更多信息,请参阅在 CloudWatch 中查看 Network Flow Monitor 指标

范围

在网络流量监测仪中,范围指的是查看网络性能指标时可观测到的一个或多个账户。若以管理账户身份登录并通过 CloudWatch 配置 Amazon Organizations,则可将范围设置为组织中的多个账户(最多 100 个账户)。否则,若使用在组织中没有管理权限的 Amazon Web Services 账户登录,或者尚未为组织配置 CloudWatch,则网络流量监测仪会将范围设置为登录时所使用的账户。

Network Flow Monitor 为该范围生成唯一的范围 ID。指标数据的查询使用范围 ID 来确定 Network Flow Monitor 为其生成指标的资源。(必须先安装代理来收集和提交指标数据,然后才能使用 Network Flow Monitor 查看账户的性能指标。)

查询 ID

Network Flow Monitor 会为每个查询(这些查询的创建目的为检索性能指标数据)生成唯一的查询 ID,例如用于了解监测仪排名靠前的贡献者的查询。通过在 Network Flow Monitor 中将查询 ID 与 API 调用配合使用,您可以检查查询的状态、停止查询、重新运行查询或以其他方式处理查询。

性能指标

Network Flow Monitor 收集和计算端到端性能指标,包括 TCP 往返时间(RTT)、TCP 重新传输、TCP 重新传输超时以及 Network Flow Monitor 范围内各流量的已传输字节。该服务将汇总这些指标并将其返回到服务后端。您可以按指标类型查看排名靠前的贡献者。当您发现 Network Flow Monitor 中存在异常时,也可以检查网络运行状况指标(NHI),确定是否存在 Amazon 底层网络问题。

请注意,RTT 数据可能很稀疏,因为并不总是计算 RTT。

您还可以根据这些指标使用 Amazon CloudWatch 功能,创建控制面板、警报和通知。例如,您可以通过查看 使用 Network Flow Monitor 创建警报 中的信息来了解如何使用 Network Flow Monitor 指标设置警报。