Amazon Elastic Container Service 中的日志记录和监控
监控是保持 Amazon Elastic Container Service 和您的其他 Amazon 解决方案的可靠性、可用性和性能的重要方面。您应该从 Amazon 解决方案的各个部分收集监控数据,以便您可以更轻松地调试多点故障(如果发生)。Amazon 提供了多种工具来监控您的 Amazon ECS 资源并对潜在事件做出响应:
- Amazon CloudWatch 警报
-
按您指定的时间段观察单个指标,并根据相对于给定阈值的指标值在若干时间段内执行一项或多项操作。具体操作是:通知已发送到 Amazon Simple Notification Service(Amazon SNS)主题或 Amazon EC2 Auto Scaling 策略。CloudWatch 告警不调用操作,因为这些操作处于特定状态;状态必须改变并保持指定时间。有关更多信息,请参阅 使用 CloudWatch 监控 Amazon ECS。
对于具有使用 Fargate 启动类型的任务的服务,您可以使用 CloudWatch 警报根据 CloudWatch 指标(如 CPU 和内存利用率)在服务中扩展或缩减任务。有关更多信息,请参阅 自动扩展 Amazon ECS 服务。
对于具有使用 EC2 启动类型的任务或服务的集群,您可以使用 CloudWatch 警报来根据 CloudWatch 指标(例如集群内存预留)横向缩减和横向扩展容器实例。
- Amazon CloudWatch Logs
-
通过在任务定义中指定
awslogs
日志驱动程序,监控、存储和访问来自 Amazon ECS 任务中的容器的日志文件。有关更多信息,请参阅使用 awslogs 驱动程序。您也可以从 Amazon ECS 容器实例监控、存储和访问操作系统及 Amazon ECS 容器代理日志文件。这种访问日志的方法可以用于使用 EC2 启动类型的容器。
- Amazon CloudWatch Events
-
匹配事件并将事件传送到一个或多个目标函数或流来进行更改、捕获状态信息和采取纠正措施。有关更多信息,请参阅本指南中的 使用 EventBridge 自动响应 Amazon ECS 错误以及《Amazon EventBridge 用户指南》中的 EventBridge is the evolution of Amazon CloudWatch Events。
- Amazon CloudTrail 日志
-
CloudTrail 提供了用户、角色或 Amazon 服务在 Amazon ECS 中所执行操作的记录。使用由 CloudTrail 收集的信息,您可以确定向 Amazon ECS 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。有关更多信息,请参阅 使用 Amazon CloudTrail 记录 Amazon ECS API 调用。
- Amazon Trusted Advisor
-
Trusted Advisor 凝聚了从为数十万 Amazon 客户提供服务中总结的最佳实践。Trusted Advisor 可检查您的 Amazon 环境,然后在有可能节省开支、提高系统可用性和性能或弥补安全漏洞时为您提供建议。所有 Amazon 客户均有权访问五个 Trusted Advisor 检查。使用“商业”和“企业”支持计划的客户可以查看所有 Trusted Advisor 检查。
有关更多信息,请参阅《Amazon Web Services Support 用户指南》中的 Amazon Trusted Advisor。
- Amazon Compute Optimizer
-
Amazon Compute Optimizer 是一种服务,用于分析 Amazon 资源的配置和利用率指标。它将报告您的资源是否处于最佳状态并生成优化建议,以降低成本并提高工作负载的性能。
有关更多信息,请参阅 针对 Amazon ECS 的 Amazon Compute Optimizer 建议。
监控 Amazon ECS 的另一个重要环节是手动监控 CloudWatch 警报未涵盖的那些项。CloudWatch、Trusted Advisor 和其他 Amazon 控制台控制面板提供 Amazon 环境状态的概览视图。建议您也可以查看容器实例上的日志文件以及任务中的容器。