网络综合监测仪的工作原理
网络综合监测仪由 Amazon 完全托管,不需要在受监测的资源上单独安装代理。相反,您可以通过提供 VPC 子网和本地 IP 地址来指定探测器。
在网络综合监测仪中为 Amazon 托管资源创建监测仪时,Amazon 会在后台创建和管理基础设施,用来执行往返时间和丢包测量。由于 Amazon 托管所需的配置,因此您无需在 Amazon 基础设施中安装或卸载代理,即可快速扩展监控规模。
创建探测器时,系统会创建自定义弹性网络接口(ENI),然后附加到探测器实例和客户子网。例如,如果网络综合监测仪取代了探测器实例,网络综合监测仪会分离 ENI 并将其重新附加到替代探测器。这意味着 ENI IP 地址在创建后不会更改,除非您删除探测器并为相同的源和目标创建新的探测器。
网络综合监测仪重点监测来自 Amazon 托管资源的流量所采用的路由,而不是广泛监测来自 Amazon Web Services 区域 的所有流量。如果您的工作负载分布在多个可用区中,则网络综合监测仪可以监测来自您各个私有子网的路由。
网络综合监测仪根据您在创建监测仪时设置的聚合间隔向您的 Amazon CloudWatch 账户发布往返时间和丢包率指标。您还可以使用 CloudWatch 为每个监测仪设置单独的延迟和丢包率阈值。例如,您可以为易受丢包率影响的工作负载创建警报,在平均丢包率高于 0.1% 静态阈值时通知自己。您还可以使用 CloudWatch 异常检测功能对超出所需范围的丢包率或延迟指标发出警报。
可用性和性能测量
网络综合监测仪定期将处于活动状态的探测器从您的 Amazon 资源发送到本地目标。创建监测仪时,您可指定以下内容:
-
聚合时间间隔:CloudWatch 收到测量结果所需的时间(以秒为单位)。即每 30 秒或 60 秒一次。您为监测仪选择的聚合周期适用于该监测仪中的所有探测器。
-
探测器源(Amazon 资源):探测器源是网络运行所在区域中的 VPC 和关联子网,或者只有 VPC 子网。
-
探测器(客户资源):探测器的目标是本地 IP 地址、网络协议、端口和网络数据包大小的组合。
-
探测器协议:支持 ICMP 或 TCP 协议。有关更多信息,请参阅 支持的通信协议。
-
端口(对于 TCP):您的网络用于连接的端口。
-
数据包大小(对于 TCP):单个探测器在 Amazon 托管资源和目标之间传输的各个数据包大小(以字节为单位)。您可以为监测仪中的每个探针指定不同的数据包大小。
监测仪发布的指标如下:
-
往返时间:此指标以微秒为单位,是衡量性能的指标。它会记录探针传输到目标 IP 地址以及接收关联响应所花的时间。往返时间是在聚合时间间隔内观察到的平均时间。
-
丢包率:该指标会测量已发送数据包总数的百分比,并记录未收到关联响应的传输的数量。没有响应意味着数据包在网络路径上丢失。
支持的通信协议
网络综合监测仪支持两种探测器协议:ICMP 和 TCP。
基于 ICMP 的探测器将来自 Amazon 托管资源的 ICMP 回显请求传送到目标地址,并期望得到 ICMP 回显回复。网络综合监测仪使用 ICMP 回显请求和回复消息的相关信息来计算往返时间和丢包率指标。
基于 TCP 的探测器将 TCP SYN 数据包从您的 Amazon 托管资源传输到目标地址和端口,并预期得到 TCP SYN+ACK 数据包响应。网络综合监测仪使用 TCP SYN 与 TCP SYN+ACK 消息的相关信息来计算往返时间和丢包率指标。网络综合监测仪会定期切换源 TCP 端口,以此扩大网络覆盖范围,从而提高检测到丢包的概率。
Amazon 的网络运行状况指标
网络综合监测仪会发布网络运行状况指标(NHI),该指标可为包含通过 Amazon Direct Connect 连接的目标路径提供有关 Amazon 网络问题的信息。使用 Cloud WAN 或使用 Amazon Transit Gateway 创建的 Amazon Direct Connect 附件不支持 NHI。NHI 二进制值基于统计指标,该指标用于衡量从 Amazon 托管资源(即监测仪部署位置)到 Direct Connect 位置的 Amazon 受控网络路径运行状况。
网络综合监测仪利用异常检测功能来计算网络路径的可用性下降或性能下降情况。
注意
每次创建新监测仪、添加探针或重新激活探针时,该监测仪的 NHI 将延迟几小时,同时 Amazon 会收集数据用于执行异常检测。
为了提供 NHI 值,网络综合监测仪将统计相关性应用于 Amazon 示例数据集,以及模拟网络路径的流量的丢包率和往返延迟指标。NHI 可以是以下两个值之一:1 或 0。值为 1 表示网络综合监测仪观测到 Amazon 受控网络路径中出现网络性能下降的情况。值为 0 表示网络综合监测仪未观测到路径中 Amazon 网络出现任何网络性能下降的情况。使用 NHI 值可以让您更快地了解导致网络问题的原因。例如,您可以为 NHI 指标设置警报,这样在网络路径中 Amazon 网络发生问题时,您就会收到通知。
支持 IPv4 和 IPv6 地址
网络综合监测仪可通过 IPv4 或 IPv6 网络提供可用性和性能指标,且可监测来自双堆栈 VPC 的 IPv4 或 IPv6 地址。网络综合监测仪不允许在同一监测仪中同时配置 IPv4 和 IPv6 目标;但您可以为仅限 IPv4 和仅限 IPv6 的目标单独创建监测仪。