日志记录和监控 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

日志记录和监控

您可以使用 Amazon CloudWatch 监控 Amazon SageMaker,此工具可收集原始数据,并将数据处理为便于读取的近乎实时的指标。这些统计数据会保存 15 个月,从而使您能够访问历史信息,并能够更好地了解您的 Web 应用程序或服务的执行情况。此外,可以设置用于监测特定阈值的警报,并在达到相应阈值时发送通知或执行操作。有关更多信息,请参阅使用 Amazon SageMaker 监控 Amazon CloudWatch

Amazon CloudWatch Logs 使您能够监控、存储和访问来自 Amazon EC2 实例、AWS CloudTrail 和其他来源的日志文件。您可以收集和跟踪指标,创建自定义控制面板,以及设置警报以在指定的指标达到您指定的阈值时通知您或采取措施。CloudWatch Logs 可以监控日志文件中的信息,并在达到特定阈值时通知您。您还可以在高持久性存储中检索您的日志数据。有关更多信息,请参阅使用 Amazon SageMaker 记录事件 Amazon CloudWatch

AWS CloudTrail 提供用户、角色或 AWS 服务在 SageMaker 中执行的操作记录。利用 CloudTrail 收集的信息,您可以确定向 SageMaker 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。有关更多信息,请参阅 使用 Amazon SageMaker 记录 AWS CloudTrail API 调用

注意

CloudTrail 不监控对 runtime_InvokeEndpoint 的调用。

您可以在 Amazon CloudWatch Events 中创建规则以响应 SageMaker 训练、超参数优化或批量转换作业中的状态更改。有关更多信息,请参阅使用 Amazon SageMaker 实现 Amazon EventBridge 自动化