本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
监控 Amazon ECS
监控是维护 Amazon ECS 和您的 Amazon 解决方案的可靠性、可用性和性能的重要组成部分。您应该从 Amazon 解决方案的所有部分收集监控数据,以便在出现多点故障时可以更轻松地进行调试。在开始监控 Amazon ECS 之前,请制定一份包含以下问题答案的监控计划:
-
监控目的是什么?
-
您将监控哪些资源?
-
监控这些资源的频率如何?
-
您将使用哪些监控工具?
-
谁负责执行监控任务?
-
出现错误时应通知谁?
可用的指标将取决于集群中任务和服务的启动类型。如果您为服务使用 Fargate 启动类型,则会提供 CPU 和内存利用率指标以帮助监视您的服务。对于 Amazon EC2 启动类型,您将拥有并需要监控构成底层基础设施的 EC2 实例。集群、服务和任务中还提供了其他 CPU 和内存预留及利用率指标。
下一步,通过在不同时间和不同负载条件下测量性能,在您的环境中建立正常 Amazon ECS 性能的基准。在监控 Amazon ECS 时,存储历史监控数据,以便将此数据与当前性能数据进行比较,确定正常性能模式和性能异常,并设计解决问题的方法。
要建立基准,至少应监控以下项目:
-
您的 Amazon ECS 集群的 CPU 以及内存预留和利用率指标
-
您的 Amazon ECS 服务的 CPU 和内存利用率指标
有关更多信息,请参阅 查看 Amazon ECS 指标。
主题
- 监控 Amazon ECS 的最佳实践
- 适用于 Amazon ECS 的监控工具
- 使用监控 Amazon ECS CloudWatch
- 使用自动响应 Amazon ECS 错误 EventBridge
- 使用容器见解监控 Amazon ECS 容器
- 使用容器运行状况检查确定 Amazon ECS 任务运行状况
- 监控 Amazon ECS 容器实例运行状况
- 使用应用程序跟踪数据识别 Amazon ECS 的优化机会
- 使用应用程序指标关联 Amazon ECS 应用程序性能
- 使用记录 Amazon ECS API 调用 Amazon CloudTrail
- 使用运行时监控识别未经授权的行为
- 使用 ECS Exec 监控亚马逊 ECS 容器
- Amazon Compute Optimizer 针对 Amazon ECS 的建议