使用记录 Amazon Lake Formation API 调用 Amazon CloudTrail - Amazon Lake Formation
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用记录 Amazon Lake Formation API 调用 Amazon CloudTrail

Amazon Lake Formation 与 Amazon CloudTrail一项服务集成,该服务提供用户、角色或 Amazon 服务在 Lake Formation 中采取的操作的记录。 CloudTrail 将所有 Lake Formation API 调用捕获为事件。捕获的调用包括来自 Lake Formation 控制台的调用 Amazon Command Line Interface、以及对 Lake Formation API 操作的代码调用。如果您创建了跟踪,则可以允许将 CloudTrail事件持续传输到 Amazon S3 存储桶,包括 Lake Formation 的事件。如果您未配置跟踪,您仍然可以在 CloudTrail 控制台的 “事件历史记录” 中查看最新的事件。使用收集的信息 CloudTrail,您可以确定向 Lake Formation 发出的请求、发出请求的 IP 地址、谁提出了请求、何时提出请求以及其他详细信息。

要了解更多信息 CloudTrail,请参阅《Amazon CloudTrail 用户指南》

Lake Formation 信息在 CloudTrail

CloudTrail 在创建新 Amazon 账户时默认处于启用状态。当 Lake Formation 中发生活动时,该活动将与其他 Amazon 服务 CloudTrail 事件一起记录在事件历史记录中。一个事件表示来自任何源的一个请求,包括有关所请求的操作、操作的日期和时间以及请求参数等方面的信息。此外,每个事件或日志条目都包含有关生成请求的人员的信息。身份信息有助于您确定以下内容:

  • 请求是使用根证书还是 Amazon Identity and Access Management (IAM) 用户凭证发出。

  • 请求是使用角色还是联合用户的临时安全凭证发出的。

  • 请求是否由其他 Amazon 服务发出。

有关更多信息,请参阅CloudTrail 用户身份元素

您可以查看、搜索和下载您 Amazon 账户的近期活动。有关更多信息,请参阅使用事件历史记录查看 CloudTrail 事件

要持续记录 Amazon 账户中的事件,包括 Lake Formation 的事件,请创建跟踪。跟踪允许 CloudTrail 将日志文件传输到 Amazon S3 存储桶。在控制台创建跟踪时,跟踪默认应用于所有 Amazon 区域。跟踪记录 Amazon 分区中所有区域的事件,并将日志文件传送到您指定的 Amazon S3 存储桶。此外,您可以配置其他 Amazon 服务(例如) Amazon Athena,以进一步分析 CloudTrail 日志中收集的事件数据并对其采取行动。 CloudTrail 还可以将日志文件传输到 Amazon CloudWatch 日志和 CloudWatch 事件。

有关更多信息,请参阅下列内容:

了解 Lake Formation 事件

所有 Lake Formation API 操作都由《开发者指南》记录 CloudTrail 并记录在《 Amazon Lake Formation 开发者指南》中。例如,对PutDataLakeSettingsGrantPermissions、和RevokePermissions操作的调用会在 CloudTrail 日志文件中生成条目。

以下示例显示了该GrantPermissions操作 CloudTrail 的事件。该条目包括已授予权限的用户 (datalake_admin)、被授予权限的主体 (datalake_user1) 以及所授予的权限 (CREATE_TABLE)。该条目还显示授权失败,原因是 resource 参数中未指定目标数据库。

{ "eventVersion": "1.08", "userIdentity": { "type": "IAMUser", "principalId": "AIDAZKE67KM3P775X74U2", "arn": "arn:aws:iam::111122223333:user/datalake_admin", "accountId": "111122223333", "accessKeyId": "...", "userName": "datalake_admin" }, "eventTime": "2021-02-06T00:43:21Z", "eventSource": "lakeformation.amazonaws.com", "eventName": "GrantPermissions", "awsRegion": "us-east-1", "sourceIPAddress": "72.21.198.65", "userAgent": "aws-cli/1.19.0 Python/3.6.12 Linux/4.9.230-0.1.ac.223.84.332.metal1.x86_64 botocore/1.20.0", "errorCode": "InvalidInputException", "errorMessage": "Resource must have one of the have either the catalog, table or database field populated.", "requestParameters": { "principal": { "dataLakePrincipalIdentifier": "arn:aws:iam::111122223333:user/datalake_user1" }, "resource": {}, "permissions": [ "CREATE_TABLE" ] }, "responseElements": null, "requestID": "b85e863f-e75d-4fc0-9ff0-97f943f706e7", "eventID": "8d2ccef0-55f3-42d3-9ede-3a6faedaa5c1", "readOnly": false, "eventType": "AwsApiCall", "managementEvent": true, "eventCategory": "Management", "recipientAccountId": "111122223333" }

下一个示例显示了该GetDataAccess操作的 CloudTrail 日志条目。主体不会直接调用此 API。相反,GetDataAccess每当主体或集成 Amazon 服务请求临时凭证以访问注册到 Lake Formation 的数据湖位置的数据时,就会记录下来。

{ "eventVersion": "1.05", "userIdentity": { "type": "AWSAccount", "principalId": "AROAQGFTBBBGOBWV2EMZA:GlueJobRunnerSession", "accountId": "111122223333" }, "eventSource": "lakeformation.amazonaws.com", "eventName": "GetDataAccess", ... ... "additionalEventData": { "requesterService": "GLUE_JOB", "lakeFormationPrincipal": "arn:aws:iam::111122223333:role/ETL-Glue-Role", "lakeFormationRoleSessionName": "AWSLF-00-GL-111122223333-G13T0Rmng2" }, ... }