监控 Amazon Direct Connect 资源 - Amazon Direct Connect
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 Amazon Direct Connect 资源

监控是维护 Amazon Direct Connect 资源可靠性、可用性和性能的重要环节。您应从 Amazon 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。不过,在开始监控 Amazon Direct Connect; 之前,您应制定一个监控计划并在计划中回答下列问题:

  • 监控目的是什么?

  • 应监控哪些资源?

  • 监控这些资源的频率应如何?

  • 您可以使用哪些监控工具?

  • 谁执行监控任务?

  • 出现错误时应通知谁?

下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Amazon Direct Connect 性能的基准。在监控 Amazon Direct Connect 时,存储历史监控数据。这样,您可以将历史监控数据与当前性能数据进行比较,确定性能的正常模式和性能异常,并找出解决问题的方法。

要建立基准,您应监控 Amazon Direct Connect 物理连接的使用情况、状态和运行状况。

监控工具

Amazon 为您提供了各种可以用来监控 Amazon Direct Connect 连接的工具。您可以配置其中的一些工具来为您执行监控任务,但有些工具需要手动干预。建议您尽可能实现监控任务自动化。

自动监控工具

您可以使用以下自动化监控工具来监控 Amazon Direct Connect 并在出现错误时报告:

  • Amazon CloudWatch 警报 — 在您指定的时间段内观察单个指标。在多个时间段内根据相对于给定阈值的指标值,执行一项或多项操作。该操作是发送给 Amazon SNS 主题的通知。 CloudWatch 警报不会仅仅因为它们处于特定状态就调用操作;该状态必须已更改并保持了指定的时间段。有关可用指标和维度的信息,请参阅 使用 Amazon 进行监控 CloudWatch

  • Amazon CloudTrail日志监控-在账户之间共享日志文件,并通过将 CloudTrail 日志文件发送到 “日志” 来实时监控 CloudWatch 日志文件。您还可以使用 Java 编写日志处理应用程序并确认您的日志文件在 CloudTrail 传送后未发生更改。有关更多信息,请参阅使用 Amazon CloudTrail 记录 Amazon Direct Connect API 调用Amazon CloudTrail用户指南》中的 “使用 CloudTrail 日志文件”。

手动监控工具

监控Amazon Direct Connect连接的另一个重要部分是手动监控 CloudWatch 警报未涵盖的项目。Amazon Direct Connect和 CloudWatch控制台仪表板提供了Amazon环境状态的 at-a-glance 视图。

  • 该 Amazon Direct Connect 控制台显示:

    • 连接状态 (请参阅 State 列)

    • 虚拟接口状态 (请参阅 State 列)

  • CloudWatch 主页显示:

    • 当前告警和状态

    • 告警和资源图表

    • 服务运行状况

    此外,您还可以使用 CloudWatch 执行以下操作:

    • 创建自定义控制面板以监控您关心的服务。

    • 绘制指标数据图,以排除问题并弄清楚趋势。

    • 搜索并浏览您所有的 Amazon 资源指标。

    • 创建和编辑警报以接收有关问题的通知。