使用亚马逊监控 Route 53 解析器终端节点 CloudWatch - Amazon Route 53
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用亚马逊监控 Route 53 解析器终端节点 CloudWatch

您可以使用 Amazon CloudWatch 来监控由 Route 53 解析器终端节点转发的 DNS 查询数量。Amazon CloudWatch 收集原始数据并将其处理为可读的近乎实时的指标。这些统计数据会保存两周,以便您访问历史信息并更好地了解资源的运行情况。默认情况下,Resolver 端点的指标数据每隔五分钟自动发送 CloudWatch一次。五分钟间隔也是可以发送指标数据的最小间隔。

有关 Resolver 的更多信息,请参阅 什么是 Amazon Route 53 Resolver?。有关的更多信息 CloudWatch,请参阅 Amazon 是什么 CloudWatch? 在《亚马逊 CloudWatch 用户指南》中。

Route 53 Resolver 的指标与维度

当你将 Resolver 配置为将 DNS 查询转发到你的网络,反之亦然时,Resolver 开始每五分钟发送一次指标维度, CloudWatch 大约相当于转发的查询数量。您可以使用以下过程在 CloudWatch 控制台中查看指标或使用 Amazon Command Line Interface (Amazon CLI) 查看这些指标。

使用控制台查看 Resolver 指标 CloudWatch
  1. 打开 CloudWatch 控制台,网址为https://console.aws.amazon.com/cloudwatch/

  2. 在导航栏上,选择您在其中创建了端点的区域。

  3. 在导航窗格中,选择指标

  4. 全部指标选项卡上,选择 Route 53 Resolver (Route 53 解析程序)

  5. 选择 By Endpoint (按端点) 以查看指定端点的查询计数。然后,选择您想要查看其查询数的端点。

    选择 “跨所有终端节点” 可查看当前 Amazon 账户创建的所有入站终端节点或所有出站终端节点的查询计数。然后选择InboundQueryVolumeOutboundQueryVolume以查看所需的计数。

要查看指标,请使用 Amazon CLI
  • 在命令提示符处输入下面的命令:

    aws cloudwatch list-metrics --namespace "AWS/Route53Resolver"

CloudWatch Route 53 Resolver 的指标

AWS/Route53Resolver 命名空间包括 Route 53 Resolver 端点以及 IP 地址的各种指标。

Resolver 端点的指标

AWS/Route53Resolver 命名空间包括 Route 53 Resolver 端点的以下指标。

EndpointHealthyENICount

处于 OPERATIONAL 状态的弹性网络接口数。这表示此端点(由 EndpointId 指定)的 Amazon VPC 网络接口配置正确,并能够在您的网络和 Resolver 之间传递入站和出站 DNS 查询。

有效统计数据:Minimum、Maximum、Sum、Average

单位:计数

EndpointUnhealthyENICount

处于 AUTO_RECOVERING 状态的弹性网络接口数。

这意味着解析程序正在尝试恢复一个或多个与端点关联的 Amazon VPC 网络接口(由 EndpointId 指定)。在恢复过程中,端点会工作但容量受限,并且在完全恢复之前无法处理 DNS 查询。

有效统计数据:Minimum、Maximum、Sum、Average

单位:计数

InboundQueryVolume

对于入站终端节点,指 VPCs 通过指定的终端节点从您的网络转发到您的网络的 DNS 查询数量EndpointId

有效统计数据:Sum

单位:计数

OutboundQueryVolume

对于出站终端节点,指通过指定的终端节点从您的网络转发 VPCs 到您的网络的 DNS 查询数量EndpointId

有效统计数据:Sum

单位:计数

OutboundQueryAggregateVolume

对于出站终端节点,指从 Amazon 转发 VPCs 到您的网络的 DNS 查询总数,包括以下内容:

  • 通过由指定的终端节点从您的网络转发 VPCs 到您的网络的 DNS 查询数量EndpointId

  • 当当前账户与其他账户共享 Resolver 规则时 VPCs ,由其他账户创建的查询将通过EndpointId指定的终端节点转发到您的网络。

有效统计数据:Sum

单位:计数

ResolverEndpointCapacityStatus

解析器端点的容量状态。该指标表示当前的容量利用率状态,其中:0 = 正常(正常运行容量),1 = 警告(至少有一个弹性网络接口的容量利用率超过 50%),2 = 严重(至少一个弹性网络接口的容量利用率超过 75%)。

容量状态由多个因素决定,包括查询量、查询延迟、DNS 协议、DNS 数据包大小和连接跟踪状态。

有效统计数据:最大值

单位:无

注意

在某些情况下,您可能会发现该指标存在差距。当您的网络接口连续进行定期维护或更新时,可能会出现这些间隙。将网络接口返回服务后,我们的服务至少需要 1 分钟才能收集运营数据并发布该指标。这些差距并不表示您的 Resolver 终端节点出现故障。如果您要为此指标配置 CloudWatch 警报,我们建议您执行以下操作:

  • 将警报设置为 “将丢失的数据视为忽略”。

  • 为警报阈值配置五分钟以上的评估期。

这些设置将有助于减少正常维护活动期间的误报。

解析器端点容量管理的最佳实践

为了解决容量问题,我们通常建议您增加 Resolver 终端节点的弹性网络接口数量。但是,对于特定的端点类型,有一些重要的注意事项:

对于入站端点,流量负载平衡取决于客户。因此,容量警告或严重警报可能表示存在一个 “热点”,其中一部分弹性网络接口的利用率不成比例。

  • 要确定潜在的负载平衡问题,请分别检查每个 elastic network interface 的InboundQueryVolume指标。

对于出站终端节点,流量将在弹性网络接口之间自动平衡。容量问题可能是由于目标名称服务器出现问题,也可能是由于高延迟的超时查询使解析器网络接口不堪重负。

  • 在这些情况下,仅仅增加弹性网络接口可能无效,我们建议修复目标名称服务器。

Resolver IP 地址的指标

AWS/Route53Resolver 命名空间包括与 Resolver 入站或出站端点关联的每个 IP 地址的以下指标。(当您指定端点时,Resolver 将创建 Amazon VPC 弹性网络接口。)

InboundQueryVolume

对于入站端点的每个 IP 地址,从您的网络转发到指定 IP 地址的 DNS 查询数。每个 IP 地址都由 IP 地址 ID 标识。您可以使用 Route 53 控制台获取此值。在适用端点的页面上,在“IP 地址”部分中参阅 IP address ID (IP 地址 ID) 列。您也可以使用ListResolverEndpointIpAddresses以编程方式获取值。

有效统计数据:Sum

单位:计数

OutboundQueryAggregateVolume

对于您的出站终端节点的每个 IP 地址,从亚马逊转发 VPCs 到您的网络的 DNS 查询总数,包括以下内容:

  • 使用指定 IP 地址从您的网络转发 VPCs 到您的网络的 DNS 查询数量。

  • 当当前账户与其他账户共享 Resolver 规则时 VPCs ,来自这些规则的查询由其他账户创建,然后使用指定的 IP 地址转发到您的网络。

每个 IP 地址都由 IP 地址 ID 标识。您可以使用 Route 53 控制台获取此值。在适用端点的页面上,在“IP 地址”部分中参阅 IP address ID (IP 地址 ID) 列。您也可以使用ListResolverEndpointIpAddresses以编程方式获取值。

有效统计数据:Sum

单位:计数

Route 53 Resolver 指标的维度

入站和出站端点的 Route 53 指标使用 AWS/Route53Resolver 命名空间并提供了 EndpointId 的指标。如果您为EndpointId维度指定值,则 CloudWatch 返回指定终端节点的 DNS 查询次数。如果您未指定EndpointId,则 CloudWatch 返回当前 Amazon 账户为所有终端节点创建的 DNS 查询次数。

OutboundQueryAggregateVolumeInboundQueryVolume 指标支持 RniId 维度。