日志记录和监控 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

日志记录和监控

您可以使用 Amazon CloudWatch 监控 Amazon SageMaker。Amazon CloudWatch 会收集原始数据并将其处理为易读且近乎实时的指标。这些统计数据会保存 15 个月,从而使您能够访问历史信息,并能够更好地了解您的 Web 应用程序或服务的执行情况。此外,可以设置用于监测特定阈值的警报,并在达到相应阈值时发送通知或执行操作。有关更多信息,请参阅 使用 Amazon CloudWatch 监控 Amazon SageMaker

Amazon CloudWatch Logs 使您能够监控、存储和访问来自 Amazon EC2 实例、Amazon CloudTrail 和其他来源的日志文件。您可以收集和跟踪指标,创建自定义的控制面板,以及设置警报以在指定的指标达到您指定的阈值时通知您或采取措施。CloudWatch Logs 可以监控日志文件中的信息,并在达到特定阈值时通知您。您还可以在高持久性存储中检索您的日志数据。有关更多信息,请参阅 使用 Amazon CloudWatch 记录 Amazon SageMaker 事件

Amazon CloudTrail 提供用户、角色或 Amazon 服务在 SageMaker 中执行的操作记录。使用 CloudTrail 收集的信息,您可以确定向 SageMaker 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。有关更多信息,请参阅使用 Amazon CloudTrail 记录 Amazon SageMaker API 调用

注意

CloudTrail 不监控对 runtime_InvokeEndpoint 的调用。

您可以在 Amazon CloudWatch Events 中创建规则以响应 SageMaker 训练、超参数优化或批量转换作业中的状态更改。有关更多信息,请参阅 使用 Amazon EventBridge 自动执行 Amazon SageMaker