使用 Amazon CloudTrail 记录 Amazon SageMaker API 调用 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

使用 Amazon CloudTrail 记录 Amazon SageMaker API 调用

Amazon SageMaker 与 Amazon CloudTrail 集成,后者是在 SageMaker 中提供用户、角色或 Amazon 服务所采取操作的记录的服务。CloudTrail 将 SageMaker 的所有 API 调用作为事件捕获,但 InvokeEndpointInvokeEndpointAsync 除外。捕获的调用中包括从 SageMaker 控制台发出的调用以及对 SageMaker API 操作发出的代码调用。如果您创建跟踪记录,则可以使 CloudTrail 事件持续传送到 Amazon S3 存储桶(包括 SageMaker 的事件)。如果您不配置跟踪,则仍可在 CloudTrail 控制台中的事件历史记录中查看最新事件。使用 CloudTrail 收集的信息,您可以确定向 SageMaker 发出了什么请求、发出请求的 IP 地址、何人发出的请求、请求的发出时间以及其他详细信息。

要了解有关 CloudTrail 的更多信息,请参阅 Amazon CloudTrail 用户指南

默认情况下,日志数据将无限期存储在 CloudWatch Logs 中。但是,您可以配置要在日志组中存储日志数据多长时间。有关更多信息,请参阅《Amazon CloudWatch Logs 用户指南》中的更改 CloudWatch Logs 中的日志数据留存

CloudTrail 中的 SageMaker 信息

在您创建 Amazon 账户时,将在该账户上启用 CloudTrail。当 Amazon SageMaker 中发生活动时,该活动将记录在 CloudTrail 事件中,并与其它 Amazon 服务事件一同保存在事件历史记录中。您可以在 Amazon 账户中查看、搜索和下载最新事件。有关更多信息,请参阅使用 CloudTrail 事件历史记录查看事件

要持续记录 Amazon 账户中的事件(包括 Amazon SageMaker 的事件),请创建跟踪记录。通过跟踪记录,CloudTrail 可将日志文件传送至 Amazon S3 存储桶。预设情况下,在控制台中创建跟踪时,此跟踪应用于所有 Amazon 区域。此跟踪记录在 Amazon 分区中记录所有区域中的事件,并将日志文件传送至您指定的 Amazon S3 桶。此外,您可以配置其他 Amazon 服务,进一步分析在 CloudTrail 日志中收集的事件数据并采取行动。有关更多信息,请参阅下列内容:

除了 InvokeEndpoint InvokeEndpointAsync 之外,所有 SageMaker 操作都由 CloudTrail 记录并记载在 Operations 中。例如,对 CreateTrainingJobCreateEndpointCreateNotebookInstance 操作的调用会在 CloudTrail 日志文件中生成条目。

每个事件或日志条目都包含有关生成请求的人员信息。身份信息可帮助您确定以下内容:

  • 请求是使用根用户凭证还是 IAM 用户凭证发出的。

  • 请求是使用角色还是联合身份用户的临时安全凭证发出的。

  • 请求是否由其它 Amazon 服务发出。

有关更多信息,请参阅 CloudTrail userIdentity 元素

由自动模型优化执行的操作

SageMaker 支持针对自动模型优化作业,将非 API 服务事件记录到您的 CloudTrail 日志文件。这些事件与您的优化作业相关,但并非客户请求公共 Amazon API 的直接结果。例如,当您通过调用 CreateHyperParameterTuningJob 创建超参数优化作业时,SageMaker 会创建训练作业以评估超参数的不同组合来查找最佳结果。与此类似,当您调用 StopHyperParameterTuningJob 来停止超参数优化作业时,SageMaker 可能会停止任何关联的正在运行的训练作业。您的优化作业的非 API 事件将记录到 CloudTrail,以协助您改进 Amazon 账户的管理、合规性以及操作和风险审核。

从非 API 服务事件生成的日志条目具有 AwsServiceEvent 而非 AwsApiCalleventType

理解 SageMaker 日志文件条目

跟踪是一种配置,可用于将事件作为日志文件传送到您指定的 S3 存储桶。CloudTrail 日志文件包含一个或多个日志条目。一个事件表示来自任何源的一个请求,包括有关请求的操作、操作的日期和时间、请求参数等方面的信息。CloudTrail 日志文件不是公用 API 调用的有序堆栈跟踪,因此它们不会按任何特定顺序显示。

以下示例为 CreateEndpoint 操作的日志条目,它创建一个端点以部署经过训练的模型。

{ "eventVersion":"1.05", "userIdentity": { "type":"IAMUser", "principalId":"AIXDAYQEXAMPLEUMLYNGL", "arn":"arn:aws:iam::123456789012:user/intern", "accountId":"123456789012", "accessKeyId":"ASXIAGXEXAMPLEQULKNXV", "userName":"intern" }, "eventTime":"2018-01-02T13:39:06Z", "eventSource":"sagemaker.amazonaws.com", "eventName":"CreateEndpoint", "awsRegion":"us-west-2", "sourceIPAddress":"127.0.0.1", "userAgent":"USER_AGENT", "requestParameters": { "endpointName":"ExampleEndpoint", "endpointConfigName":"ExampleEndpointConfig" }, "responseElements": { "endpointArn":"arn:aws:sagemaker:us-west-2:123456789012:endpoint/exampleendpoint" }, "requestID":"6b1b42b9-EXAMPLE", "eventID":"a6f85b21-EXAMPLE", "eventType":"AwsApiCall", "recipientAccountId":"444455556666" }

以下示例是 CreateModel 操作的日志条目,它创建一个或多个容器来托管以前经过训练的模型。

{ "eventVersion":"1.05", "userIdentity": { "type":"IAMUser", "principalId":"AIXDAYQEXAMPLEUMLYNGL", "arn":"arn:aws:iam::123456789012:user/intern", "accountId":"123456789012", "accessKeyId":"ASXIAGXEXAMPLEQULKNXV", "userName":"intern" }, "eventTime":"2018-01-02T15:23:46Z", "eventSource":"sagemaker.amazonaws.com", "eventName":"CreateModel", "awsRegion":"us-west-2", "sourceIPAddress":"127.0.0.1", "userAgent":"USER_AGENT", "requestParameters": { "modelName":"ExampleModel", "primaryContainer": { "image":"174872318107.dkr.ecr.us-west-2.amazonaws.com/kmeans:latest" }, "executionRoleArn":"arn:aws:iam::123456789012:role/EXAMPLEARN" }, "responseElements": { "modelArn":"arn:aws:sagemaker:us-west-2:123456789012:model/barkinghappy2018-01-02t15-23-32-275z-ivrdog" }, "requestID":"417b8dab-EXAMPLE", "eventID":"0f2b3e81-EXAMPLE", "eventType":"AwsApiCall", "recipientAccountId":"444455556666" }