本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
监控 Amazon Direct Connect 资源
监控指标是维护 Direct Connect 资源的可靠性、可用性和性能的重要环节。您应该从 Amazon 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地对其进行调试。不过,在开始监控 Direct Connect 连接之前,您应制定监控计划并在计划中回答下列问题:
-
监控目的是什么?
-
应监控哪些资源?
-
监控这些资源的频率应如何?
-
您可以使用哪些监控工具?
-
谁执行监控任务?
-
出现错误时应通知谁?
下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Direct Connect 性能的基准。在监控 Direct Connect 时,存储历史监控数据。这样,您可以将历史监控数据与当前性能数据进行比较,确定性能的正常模式和性能异常,并找出解决问题的方法。
要建立基准,您应监控 Direct Connect 物理连接的使用情况、状态和运行状况。
监控工具
Amazon 提供了可用于监视 Amazon Direct Connect 连接的各种工具。您可以配置其中的一些工具来为您执行监控任务,但有些工具需要手动干预。建议您尽可能实现监控任务自动化。
自动监控工具
您可以使用以下自动化监控工具来监控 Direct Connect 连接并在出现错误时报告:
-
Amazon CloudWatch 警报 — 在您指定的时间段内观察单个指标。在多个时间段内根据相对于给定阈值的指标值,执行一项或多项操作。该操作是发送给 Amazon SNS 主题的通知。 CloudWatch 警报不会仅仅因为它们处于特定状态就调用操作;该状态必须已更改并保持了指定的时间段。有关可用指标和维度的信息,请参阅 使用 Amazon 进行监控 CloudWatch。
Amazon CloudTrail 日志监控-在账户之间共享日志文件,并通过将 CloudTrail 日志文件发送到 “日志” 来实时监控 CloudWatch 日志文件。您还可以用 Java 编写日志处理应用程序,并验证您的日志文件在交付后是否未更改 CloudTrail。有关更多信息,请参阅记录 API 调用《Amazon CloudTrail 用户指南》中的 “使用 CloudTrail 日志文件”。
手动监控工具
监控 Amazon Direct Connect 连接的另一个重要部分是手动监控 CloudWatch 警报未涵盖的项目。Direct Connect 和 CloudWatch控制台仪表板提供了 Amazon 环境状态的 at-a-glance视图。
-
控制 Amazon Direct Connect 台显示:
-
连接状态 (请参阅 State 列)
-
虚拟接口状态 (请参阅 State 列)
-
-
CloudWatch 主页显示:
-
当前告警和状态
-
告警和资源图表
-
服务运行状况
此外,您还可以使用 CloudWatch 执行以下操作:
-
创建自定义控制面板以监控您关心的服务。
-
绘制指标数据图,以排除问题并弄清楚趋势。
-
搜索并浏览您的所有 Amazon 资源指标。
-
创建和编辑告警接收有关问题的通知。
-