Amazon CloudWatch 网络监测仪的工作原理 - Amazon CloudWatch
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon CloudWatch 网络监测仪的工作原理

网络监测仪提供完全托管且无需代理的解决方案,从而简化监控流程。在 Amazon 托管资源中创建监测仪时,Amazon 会在后台创建和管理所有基础设施,以测量往返时间和丢包率。因此,您无需在 Amazon 基础设施中安装或卸载任何代理,即可快速扩展监控规模。

网络监测仪重点监控来自 Amazon 托管资源的流量所采用的路由,而不是广泛监控来自您 Amazon Web Services 区域 的所有流量。如果您的工作负载分布在多个可用区(AZ)中,网络监测仪可以监控来自您各个私有子网的路由。

网络监测仪根据您在创建监测仪时设置的聚合间隔向您的 Amazon CloudWatch 账户发布往返时间和丢包率指标。您还可以使用 CloudWatch 为每个监测仪单独设置延迟和丢包率阈值。例如,对于易受丢包率影响的工作负载,如果您的平均丢包率高于 0.1% 静态阈值,则可以通过创建警报通知您自己。您还可以使用 CloudWatch 异常检测功能对超出所需范围的丢包率或延迟指标发出警报。

可用性和性能测量

网络监测仪定期将处于活动状态的探测器从您的 Amazon 资源发送到本地目标。创建监测仪时,需要指定以下内容:

  • 聚合间隔。CloudWatch 收到测量结果的时间(以秒为单位)。即每 30 秒或 60 秒一次。您为监测仪选择的聚合周期适用于该监测仪中的所有探测器。

  • 探测器协议。添加到监测仪的各个探测器均须使用互联网控制消息协议(ICMP)或传输控制协议(TCP)。有关更多信息,请参阅支持的通信协议

  • 数据包大小。单个探测器在 Amazon 托管资源和目标之间传输的各个数据包大小(以字节为单位)。监测仪各个探测器的数据包大小各不相同。

关于指标,

  • 往返时间指标(以毫秒为单位)会测量和记录性能指标,并记录探测器传输到目标 IP 地址以及接收其相关响应所用时间。

  • 丢包率指标会测量已发送数据包总数的百分比,并记录未收到相关响应的已传输探测器的数量,这意味着这些数据包实际是在网络路径中丢失。

支持的通信协议

基于 ICMP 的探测器将来自 Amazon 托管资源的 ICMP 回显请求传送到目标地址,并预计目标地址发回 ICMP 回显回复。网络监测仪使用 ICMP 回显请求和回复消息的相关信息来计算往返时间和丢包率指标。

基于 TCP 的探测器将 TCP SYN 数据包从您的 Amazon 托管资源传输到目标地址和端口,并预计目标地址和端口返回 TCP SYN+ACK 或 RST 数据包。网络监测仪使用 TCP SYN 与 TCP SYN+ACK 或 RST 消息的相关信息来计算往返时间和丢包率指标。此外,网络监测仪会定期切换源 TCP 端口,以此扩大网络覆盖范围并提高检测到丢包率的概率。

Amazon 网络运行状况指标

网络监测仪会发布网络运行状况指标(NHI),您可通过该指标了解通过 Amazon Direct Connect 连接的目标的网络性能和可用性等信息。该指标是一种统计指标,用于衡量从 Amazon 托管资源(即监测仪部署位置)到 Direct Connect 位置的 Amazon 受控网络路径运行状况。

网络监测仪利用异常检测功能来计算网络路径的可用性下降或性能下降情况。

注意

每次创建新监测仪、添加探测器或重新激活探测器时,该监测仪的 NHI 将延迟几小时,以便 Amazon 收集数据用于执行异常检测。

为了提供 NHI 运行状况指标,网络监测仪将统计相关性应用于 Amazon 示例数据集,以及模拟网络路径的流量的丢包率和往返延迟指标。该指标可以是变量 1 或 0。值为 1 表示网络监测仪观测到 Amazon 受控网络路径中出现网络性能下降的情况。值为 0 表示网络监测仪未观测到路径中出现任何网络性能下降的情况。这样即可帮助您更快地排查网络问题。您可以为 NHI 指标设置警报,以了解网络路径中持续存在的问题。

支持 IPv4 和 IPv6 地址

网络监测仪可通过 IPv4 或 IPv6 网络提供可用性和性能指标,且可监控来自双堆栈 VPC 的 IPv4 或 IPv6 地址。网络监测仪不允许在同一监测仪中同时配置 IPv4 和 IPv6 目标,但您可以为仅限 IPv4 和仅限 IPv6 的目标单独创建监测仪。