监控 Amazon ECS - Amazon Elastic Container Service
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控 Amazon ECS

监控是维护 Amazon ECS 和您的 Amazon 解决方案的可靠性、可用性和性能的重要组成部分。您应该从 Amazon 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地对其进行调试。不过,在开始监控 Amazon ECS 之前,您应制定一个监控计划并在计划中回答下列问题:

  • 监控目的是什么?

  • 您将监控哪些资源?

  • 监控这些资源的频率如何?

  • 您将使用哪些监控工具?

  • 谁负责执行监控任务?

  • 出现错误时应通知谁?

可用的指标将取决于集群中任务和服务的启动类型。如果您为服务使用 Fargate 启动类型,则会提供 CPU 和内存利用率指标以帮助监视您的服务。对于 Amazon EC2 启动类型,您将拥有并需要监控构成底层基础设施的 EC2 实例。其他 CPU 以及内存预留和利用率指标可在集群、服务和任务级别上使用。

下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Amazon ECS 性能的基准。在监控 Amazon ECS 时,存储历史监控数据,以便将此数据与当前性能数据进行比较,确定正常性能模式和性能异常,并设计解决问题的方法。

要建立基准,至少应监控以下项目:

  • 您的 Amazon ECS 集群的 CPU 以及内存预留和利用率指标

  • 您的 Amazon ECS 服务的 CPU 和内存利用率指标