

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 监控 Amazon A SageMaker I 中的 Amazon 资源
<a name="monitoring-overview"></a>

监控是维护 SageMaker AI 和其他 Amazon 解决方案的可靠性、可用性和性能的重要组成部分。 Amazon 提供以下监控工具，用于监视 SageMaker AI、报告何时出现问题并在适当时自动采取措施：
+ *Amazon* 会实时 CloudWatch监控您的 Amazon 资源和您运行 Amazon 的应用程序。您可以收集和跟踪指标，创建自定义的控制面板，以及设置警报以在指定的指标达到您指定的阈值时通知您或采取措施。例如，您可以 CloudWatch 跟踪您的 Amazon EC2 实例的 CPU 使用率或其他指标，并在需要时自动启动新实例。有关更多信息，请参阅 [Amazon CloudWatch 用户指南](https://docs.amazonaws.cn/AmazonCloudWatch/latest/monitoring/)。
+ *Amazon Lo CloudWatch gs* 使您能够监控、存储和访问来自 EC2 实例和其他来源的日志文件。 Amazon CloudTrail CloudWatch 日志可以监视日志文件中的信息，并在达到特定阈值时通知您。您还可以在高持久性存储中检索您的日志数据。有关更多信息，请参阅 [Amazon CloudWatch 日志用户指南](https://docs.amazonaws.cn/AmazonCloudWatch/latest/logs/)。
+ *Amazon CloudTrail*捕获由您的账户或代表您的 Amazon 账户进行的 API 调用和相关事件，并将日志文件传输到您指定的 Amazon S3 存储桶。您可以识别哪些用户和帐户拨打了电话 Amazon、发出呼叫的源 IP 地址以及呼叫发生的时间。有关更多信息，请参阅 [Amazon CloudTrail 《用户指南》](https://docs.amazonaws.cn/awscloudtrail/latest/userguide/)。
+ CloudWatch E@@ *v* ents 提供近乎实时的系统事件流，这些事件描述了 Amazon 资源的变化。创建 CloudWatch 事件规则可响应 A SageMaker I 训练、超参数调整或批量转换作业中的状态变化

**Topics**
+ [亚马逊中的亚马逊 A SageMaker I 指标 CloudWatch](monitoring-cloudwatch.md)
+ [CloudWatch 亚马逊 A SageMaker I 的日志](logging-cloudwatch.md)
+ [使用记录亚马逊 SageMaker AI API 调用 Amazon CloudTrail](logging-using-cloudtrail.md)
+ [使用 SourceDentity 监控 SageMaker 来自 AI Studio Classic](monitor-user-access.md)
+ [亚马逊 A SageMaker I 发送给亚马逊的事件 EventBridge](automating-sagemaker-with-eventbridge.md)