Athena 中的数据保护 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Athena 中的数据保护

AWS 责任共担模式适用于 Amazon Athena 中的数据保护。如该模式中所述,AWS 负责保护运行所有 AWS 云的全球基础设施。您负责维护对托管在此基础设施上的内容的控制。此内容包括您所使用的 AWS 服务的安全配置和管理任务。有关数据隐私的更多信息,请参阅数据隐私常见问题

出于数据保护目的,我们建议您保护 AWS 账户凭证并使用 AWS Identity and Access Management (IAM) 设置单独的用户账户。这仅向每个用户授予履行其工作职责所需的权限。我们还建议您通过以下方式保护您的数据:

  • 对每个账户使用 Multi-Factor Authentication (MFA)。

  • 使用 SSL/TLS 与 AWS 资源进行通信。建议使用 TLS 1.2 或更高版本。

  • 使用 AWS CloudTrail 设置 API 和用户活动日志记录。

  • 使用 AWS 加密解决方案以及 AWS 服务中的所有默认安全控制。

  • 使用高级托管安全服务(例如 Amazon Macie),它有助于发现和保护存储在 Amazon S3 中的个人数据。

  • 如果在通过命令行界面或 API 访问 AWS 时需要经过 FIPS 140-2 验证的加密模块,请使用 FIPS 终端节点。有关可用的 FIPS 终端节点的更多信息,请参阅美国联邦信息处理标准 (FIPS) 第 140-2 版

我们强烈建议您切勿将敏感的可识别信息(例如您客户的账号)放入自由格式字段(例如 Name (名称) 字段)。这包括使用控制台、API、AWS CLI 或 AWS 开发工具包处理 Athena 或其他 AWS 服务时。您输入到 Athena 或其他服务中的任何数据都可能被选取以包含在诊断日志中。当您向外部服务器提供 URL 时,请勿在 URL 中包含凭证信息来验证您对该服务器的请求。

保护多种类型的数据

当您使用 Athena 创建数据库和表时,涉及多种类型的数据。这些数据类型包括 Amazon S3 中存储的源数据、在运行查询或 AWS Glue Crawler 以发现数据时创建的数据库和表的元数据、查询结果数据,以及查询历史记录。本部分介绍每种类型的数据并提供有关保护数据的指导。

  • 源数据 – 您在 Amazon S3 中存储数据库和表的数据,并且 Athena 不修改这些数据。有关更多信息,请参阅 中的 Amazon S3 中的数据保护Amazon Simple Storage Service 开发人员指南您可以控制对您的源数据的访问并在 Amazon S3 中加密这些数据。您可以使用 Athena,在 Amazon S3 中根据加密的数据集创建表

  • 数据库和表元数据(架构)– Athena 使用基于读取的架构技术,这意味着当 Athena 运行查询时,表定义将应用于 Amazon S3 中的数据。您定义的任何架构都会自动保存,除非明确将其删除。在 Athena 中,您可以使用 DDL 语句修改 Data Catalog 元数据。您还可以删除表定义和架构,这不会影响存储在 Amazon S3 上的基础数据。

    注意

    在 Athena 中使用的数据库和表元数据存储在 AWS Glue 数据目录 中。我们强烈建议您升级以便将 AWS Glue 数据目录 与 Athena 结合使用。有关使用 AWS Glue 数据目录 的优势的更多信息,请参阅常见问题:。 升级到 AWS Glue 数据目录

    您可以使用 ) AWS Glue 数据目录定义对 AWS Identity and Access Management 中注册的数据库和表的精细访问策略IAM。您还可以对 AWS Glue 数据目录中的元数据进行加密。如果您加密元数据,请使用对加密元数据的权限进行访问。

  • 查询结果和查询历史记录,包括保存的查询 – 查询结果存储在 Amazon S3 位置中,您可以选择全局指定该位置,或者为每个工作组指定该位置。如果未指定,Athena 在每个案例中使用默认位置。您可以控制对 Amazon S3 存储桶的访问,您在这些存储桶中存储查询结果和保存的查询。此外,您可以选择加密在 Amazon S3 中存储的查询结果。您的用户必须拥有适当的权限,才能访问 Amazon S3 位置并解密文件。有关更多信息,请参阅本文中的对 Amazon S3 中存储的查询结果进行加密

    Athena 保留查询历史记录 45 天。您可以使用 、在控制台中以及使用 AWS CLI Athena查看查询历史记录APIs。要将查询存储超过 45 天时间,请保存查询。要保护对保存的查询的访问权限,请在 使用工作组Athena,仅允许有权查看保存的查询的用户访问这些查询。