Amazon Elastic Container Service
开发人员指南 (API 版本 2014-11-13)
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

监控 Amazon ECS

您可以使用 Amazon CloudWatch 监控 Amazon ECS 资源,该工具可从 Amazon ECS 中收集原始数据并将其处理为可读的、近乎实时的指标。这些统计数据会保存两周,以便您能够访问历史信息并更好地了解您的集群或服务的运行情况。Amazon ECS 指标数据以 1 分钟为间隔自动发送到 CloudWatch。有关 CloudWatch 的更多信息,请参阅 Amazon CloudWatch 用户指南

监控是保持 Amazon ECS 和您的 AWS 解决方案的可靠性、可用性和性能的重要方面。您应从 AWS 解决方案的所有部分收集监控数据,以便更轻松地调试出现的多点故障。不过,在开始监控 Amazon ECS 之前,您应制定一个监控计划并在计划中回答下列问题:

  • 您的监控目标是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

可用的指标将取决于集群中任务和服务的启动类型。如果您为服务使用 Fargate 启动类型,则会提供 CPU 和内存利用率指标来帮助监视您的服务。对于 Amazon EC2 启动类型,您将拥有并需要监视构成底层基础设施的 EC2 实例,以便在群集、服务和任务级别提供额外的 CPU 与内存预留和利用率指标。

下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Amazon ECS 性能的基准。在监控 Amazon ECS 时,存储历史监控数据,以便将此数据与当前性能数据进行比较,确定正常性能模式和性能异常,并设计解决问题的方法。

要建立基准,您至少应监控以下各项:

  • 您的 Amazon ECS 群集的 CPU 与内存预留和利用率指标

  • 您的 Amazon ECS 服务的 CPU 和内存利用率指标