监控 Amazon Direct Connect 资源 - Amazon Direct Connect
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 Amazon Direct Connect 资源

监控是维护 Direct Connect 资源的可靠性、可用性和性能的重要组成部分。您应该从 Amazon 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地对其进行调试。但是,在开始监控 Direct Connect 之前,您应该创建一个包含以下问题答案的监控计划:

  • 监控目的是什么?

  • 应监控哪些资源?

  • 监控这些资源的频率应如何?

  • 您可以使用哪些监控工具?

  • 谁执行监控任务?

  • 出现错误时应通知谁?

下一步是通过测量不同时间和不同负载条件下的性能,为环境中的正常 Direct Connect 性能建立基准。在监控 Direct Connect 时,存储历史监控数据。这样,您可以将历史监控数据与当前性能数据进行比较,确定性能的正常模式和性能异常,并找出解决问题的方法。

要建立基准,您应该监控物理 Direct Connect 连接的使用情况、状态和运行状况。

监控工具

Amazon 提供了可用于监控 Amazon Direct Connect 连接的各种工具。您可以配置其中的一些工具来为您执行监控任务,但有些工具需要手动干预。建议您尽可能实现监控任务自动化。

自动监控工具

您可以使用以下自动监控工具来监视 Direct Connect 并在出现问题时进行报告:

  • Amazon CloudWatch 警报 — 在您指定的时间段内观察单个指标。在多个时间段内根据相对于给定阈值的指标值,执行一项或多项操作。该操作是发送给 Amazon SNS 主题的通知。 CloudWatch 警报不会仅仅因为它们处于特定状态就调用操作;该状态必须已更改并保持了指定的时间段。有关可用指标和维度的信息,请参阅 使用 Amazon 进行监控 CloudWatch

  • Amazon CloudTrail 日志监控-在账户之间共享日志文件,并通过将 CloudTrail 日志文件发送到 “日志” 来实时监控 CloudWatch 日志文件。您还可以使用 Java 编写日志处理应用程序并确认您的日志文件在 CloudTrail 传送后未发生更改。有关更多信息,请参阅Amazon CloudTrail 用户指南中的使用 Amazon CloudTrail 记录 Amazon Direct Connect API 调用使用 CloudTrail 日志文件

手动监控工具

监控 Amazon Direct Connect 连接的另一个重要部分是手动监控 CloudWatch 警报未涵盖的项目。Direct Connect 和 CloudWatch控制台控制面板提供了 Amazon 环境状态的 at-a-glance 视图。

  • 控制 Amazon Direct Connect 台显示:

    • 连接状态 (请参阅 State 列)

    • 虚拟接口状态 (请参阅 State 列)

  • CloudWatch 主页显示:

    • 当前告警和状态

    • 告警和资源图表

    • 服务运行状况

    此外,您还可以使用 CloudWatch 执行以下操作:

    • 创建自定义控制面板以监控您关心的服务。

    • 绘制指标数据图,以排除问题并弄清楚趋势。

    • 搜索并浏览您的所有 Amazon 资源指标。

    • 创建和编辑告警接收有关问题的通知。