文档历史记录 - Amazon Athena
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

文档历史记录

最近文档更新:2021 年 8 月 11 日

我们经常更新文档来处理您的反馈意见。下表介绍了对 Amazon Athena 文档的重要补充部分。并非所有更新都呈现出来。

更改 描述 发行日期
添加了有关 Athena 的文档UNLOAD网页。 使用UNLOAD语句编写查询结果SELECT语句设置为阿帕奇地板、ORC、阿帕奇阿弗罗和 JSON 格式。有关更多信息,请参阅UNLOAD 2021 年 8 月 5 日
添加了有关 Athena 的文档EXPLAIN语句功能。 有关更多信息,请参阅在 Athena 中使用解释语句了解 Athena 解释声明结果 2021 年 4 月 5 日
添加了有关 Athena 故障排除和性能调整的页面。 有关更多信息,请参阅Athena 中的故障排除Athena 中的性能优化 2020 年 12 月 30 日
添加了 Athena 引擎版本控制和 Athena 引擎版本 2 的文档。 有关更多信息,请参阅Athena 引擎版本控制 2020 年 11 月 11 日
更新了一般可用版本的联合查询文档。 有关更多信息,请参阅使用 Amazon Athena 联合查询将 Athena 与 CalledVia 上下文键结合使用 2020 年 11 月 11 日
添加了有关将 JDBC 驱动程序与 Lake Formation 成的联合访问 Athena 的文档。 有关更多信息,请参阅使用 Lake Formation 和 Athena JDBC 和 ODBC 驱动程序联合访问 Athena教程:使用 Lake Formation 成和 JDBC 配置 Okta 用户对 Athena 的联合访问 2020 年 9 月 25 日
添加了 Amazon Athena 弹性搜索数据连接器的文档。 有关更多信息,请参阅Amazon Athena 弹性搜索连接器 2020 年 7 月 21 日
添加了查询 Hudi 数据集的文档。 有关更多信息,请参阅使用 Athena 查询阿帕奇胡迪数据集 2020 年 7 月 9 日
添加了有关查询存储在 Amazon S3 中的 Apache Web 服务器日志和 IIS Web 服务器日志的文档。 有关更多信息,请参阅查询存储在 Amazon S3 中的 Apache 日志查询存储在 Amazon S3 中的互联网信息服务器 (IIS) 日志 2020 年 7 月 8 日
Amazon Athena 用户指南现在支持 Kindle 格式。 Kindle 电子书是免费的。有关更多信息,请参阅 。Amazon Athena:用户指南 Kindle 版本,或者选择Kindle链接(位于在线版本的任何页面的顶部)Amazon Athena 用户指南. 2020 年 6 月 18 日
添加了针对外部 Hive 元数据仓的 Athena 般发布版本的文档。 有关更多信息,请参阅将 Athena 数据连接器用于外部配置单元存储 2020 年 6 月 1 日
添加了有关标记数据目录资源的文档。 有关更多信息,请参阅为 资源添加标签 2020 年 6 月 1 日
添加了有关分区投影的文档。 有关更多信息,请参阅Amazon Athena 分区投影 2020 年 5 月 21 日
更新了 Athena 的 Java 代码示例。 有关更多信息,请参阅代码示例 2020 年 5 月 11 日
添加了关于查询 Amazon GuardDuty 调查结果的主题。 有关更多信息,请参阅查询 Amazon GuardDuty 调查结果 2020 年 3 月 19 日
添加了有关使用 CloudWatch 事件监控 Athena 查询状态转换的主题。 有关更多信息,请参阅使用 CloudWatch 事件监控 Athena 查询 2020 年 3 月 11 日
添加了关于查询的主题Amazon Global Accelerator流日志与 Athena。 有关更多信息,请参阅查询 Amazon Global Accelerator 流日志 2020 年 2 月 6 日
  • 添加了有关将 CTAS 与 INSERT INTO 结合使用以将未分区源中的数据添加到已分区的目标的文档。

  • 添加了适用于 Athena 的 1.1.0 预览版 ODBC 驱动程序的下载链接。

  • 更正了 SHOW DATABASES LIKE 正则表达式的说明。

  • 更正了 CTA 主题中的 partitioned_by 语法。

  • 其他较小的修复。

文档更新包括但不限于以下主题:

2020 年 2 月 4 日
添加了有关将 CTAS 与 INSERT INTO 结合使用以将已分区源中的数据添加到已分区的目标的文档。 有关更多信息,请参阅使用 CTAS 和 INSERT INTO 创建带 100 多个分区的表 2020 年 1 月 22 日
更新了查询结果位置信息。 Athena 不再创建 “默认” 查询结果位置。有关更多信息,请参阅指定查询结果位置 2020 年 1 月 20 日
添加了有关查询 Amazon Glue Data Catalog 的主题。更新了有关 Athena 中的服务配额(以前称作 “服务限额”)的信息。 有关更多信息,请参阅以下主题: 2020 年 1 月 17 日
更正了有关 OpenCSVSerDe 的主题,以说明应以 UNIX 数字格式指定 TIMESTAMP 类型。 有关更多信息,请参阅用于处理 CSV 的 OpenCSVSerDe 2020 年 1 月 15 日
更新了有关加密的安全主题,以说明 Athena 不支持非对称密钥。

Athena 仅支持读取和写入数据的对称密钥。

有关更多信息,请参阅支持的 Amazon S3 加密选项
2020 年 1 月 8 日
添加了有关对 Amazon S3 存储桶进行跨账户访问的信息,此存储桶使用自定义Amazon KMS键。 有关更多信息,请参阅对使用自定义加密的存储桶的跨账户访问Amazon KMS密钥 2019 年 12 月 13 日

添加了有关联合查询、外部 Hive 元存储、机器学习和用户定义的函数的文档。添加了新的 CloudWatch 指标。

有关更多信息,请参阅以下主题: 2019 年 11 月 26 日
增加了有关新 INSERT INTO 命令的部分,并更新了查询结果位置信息以支持数据清单文件。 有关更多信息,请参阅INSERT INTO使用查询结果、输出文件和查询历史记录 2019 年 9 月 18 日

增加了有关接口 VPC 终端节点 (PrivateLink) 支持的部分。更新了 JDBC 驱动程序。更新了有关丰富的 VPC 流日志的信息。

有关更多信息,请参阅使用接口 VPC 终端节点 Connect 到 Amazon Athena查询 Amazon VPC 流日志将 Athena 与 JDBC 驱动程序结合使用

2019 年 9 月 11 日

增加了与 Amazon Lake Formation 集成的部分。

有关更多信息,请参阅使用 Athena 查询向注册的数据Amazon Lake Formation

2019 年 6 月 12 日

更新了与其他 Amazon 服务保持一致性的“安全性”部分。

有关更多信息,请参阅Amazon Athena

2019 年 6 月 12 日

增加了有关查询 Amazon WAF 日志的部分。

有关更多信息,请参阅查询 Amazon WAF 日志

2019 年 5 月 31 日

发布新版本的 ODBC 驱动程序,支持 Athena 工作组。

要下载 ODBC 驱动程序版本 1.0.5 及其文档,请参阅通过 ODBC 连接到 Amazon Athena。在工作组上使用标签时,对 ODBC 驱动程序连接字符串没有更改。要使用标签,请将 ODBC 驱动程序升级到最新版本,即此当前版本。

此驱动程序版本允许您使用Athena API 工作组操作创建和管理工作组,Athena API 标签操作以添加、列出或删除工作组上的标签。在您开始之前,请确保您在 IAM 中拥有资源级别的权限以对工作组和标签执行操作。

2019 年 3 月 5 日
添加了对 Amazon Athena 中工作组的标签支持。

标签包含您定义的一个键和一个值。您在标记工作组时,将为其分配自定义元数据。例如,为每个成本中心创建一个工作组。然后,通过将标签添加到这些组,您可以跟踪每个成本中心的 Athena 支出。有关更多信息,请参阅 。使用标签进行账单中的Amazon Billing and Cost Management用户指南.

2019 年 2 月 22 日
改进了在 Athena 中使用的 JSON OpenX SerDe。

这些改进包括但不限于以下内容:

  • 支持 ConvertDotsInJsonKeysToUnderscores 属性。设置为 TRUE 时,它允许 SerDe 使用下划线替换键名称中的点。例如,如果 JSON 数据集包含名为"a.b",您可以使用此属性将列名定义为"a_b"在 Athena。默认为 FALSE。默认情况下,Athena 不允许在列名中使用点。

  • 支持 case.insensitive 属性。默认情况下,Athena 要求 JSON 数据集中的所有键使用小写。使用 WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) 允许您在数据中使用区分大小写的键名。默认为 TRUE。设置为 TRUE 时,SerDe 将所有大写列转换为小写。

有关更多信息,请参阅OpenX JSON SerDe

2019 年 2 月 18 日
添加对工作组的支持。

可使用工作组分隔用户、团队、应用程序或工作负载,并对每个查询或整个工作组可处理的数据量设置限制。由于工作组可作为 IAM 资源,因此您可以使用资源级别的权限来控制对特定工作组的访问。您还可以在 Amazon CloudWatch 中查看与查询相关的指标,通过对扫描的数据量配置限制来控制查询成本,创建阈值,并且在达到这些阈值时触发操作,如 Amazon SNS 警报。有关更多信息,请参阅使用工作组运行查询使用 CloudWatch 指标与事件控制成本和监控查询

2019 年 2 月 18 日
增加了对分析来自 Network Load Balancer 的日志的支持。

增加了用于分析来自 Network Load Balancer 的日志的示例 Athena 查询。这些日志将接收有关发送到 Network Load Balancer 的传输层安全性 (TLS) 请求的详细信息。您可以使用这些访问日志分析流量模式并解决问题。有关信息,请参阅 查询 Network Load Balancer 日志

2019 年 1 月 24 日

发布了 JDBC 和 ODBC 驱动程序的新版本,支持通过 AD FS 和 SAML 2.0(安全断言标记语言 2.0)对 Athena API 的联合访问。

在此驱动程序版本中,Active Directory 联合身份验证服务 (AD FS 3.0) 支持对 Athena 的联合访问。访问通过支持 SAML 2.0 的 JDBC 或 ODBC 驱动程序版本建立。有关配置对 Athena API 联合访问的信息,请参阅启用对 Athena API 的联合身份访问.

2018 年 11 月 10 日

增加了对 Athena 中数据库和表的精细访问控制支持。此外,在 Athena 中添加了策略,允许您在数据目录中加密数据库和表元数据。

增加了对创建对中的资源提供精细访问控制的基于身份的 (IAM) 策略的支持。Amazon Glue Data Catalog,例如 Athena 中使用的数据库和表。

此外,您可以通过将特定策略添加到 Athena,在数据目录中加密数据库和表元数据。

有关详细信息,请参阅 针对 Amazon Glue Data Catalog 中数据库和表的精细访问权限

2018 年 10 月 15 日
增加了对 CREATE TABLE AS SELECT 语句的支持。

文档中有了其他改进。

增加了对 CREATE TABLE AS SELECT 语句的支持。请参阅从查询结果创建表注意事项和限制以及示例

2018 年 10 月 10 日

发行 ODBC 驱动程序版本 1.0.3,此版本具有对流式处理结果的支持而不是在页面中提取这些结果。

文档中有了其他改进。

ODBC 驱动程序版本 1.0.3 支持流式处理结果,并包括了改进、错误修复以及对“将 SSL 与代理服务器结合使用” 的文档更新。

有关下载 ODBC 驱动程序版本 1.0.3 及其文档的信息,请参阅通过 ODBC 连接到 Amazon Athena

2018 年 9 月 6 日

发行 JDBC 驱动程序版本 2.0.5,此版本具有对流式处理结果的默认支持而不是在页面中提取这些结果。

文档中有了其他改进。

发行 JDBC 驱动程序 2.0.5,此版本具有对流式处理结果的默认支持而不是在页面中提取这些结果。有关信息,请参阅 将 Athena 与 JDBC 驱动程序结合使用

2018 年 8 月 16 日

更新了查询 Amazon Virtual Private Cloud 流日志的文档,流日志可直接以 GZIP 格式存储在 Amazon S3 中。

更新了查询 ALB 日志的示例。

更新了查询 Amazon Virtual Private Cloud 流日志的文档,流日志可直接以 GZIP 格式存储在 Amazon S3 中。有关信息,请参阅 查询 Amazon VPC 流日志

更新了查询 ALB 日志的示例。有关信息,请参阅 查询 Application Load Balancer 日志

2018 年 8 月 7 日
添加了对视图的支持。添加了各种数据存储格式的架构操作指南。

添加了对视图的支持。有关信息,请参阅 使用视图

更新了此指南中有关如何处理各种数据存储格式的架构更新的指导。有关信息,请参阅 处理架构更新

2018 年 5 月 6 日
默认查询并发限制从 5 个提高到 20 个。

您可以同时提交并运行最多 20 个 DDL 查询和 20 个 SELECT 查询。有关信息,请参阅 Service Quotas

2018 年 5 月 17 日
增加了查询选项卡,并支持用户在查询编辑器中配置自动完成功能。

增加了查询选项卡,并支持用户在查询编辑器中配置自动完成功能。有关信息,请参阅 使用控 Console (控制台)

2018 年 5 月 8 日
发布了 JDBC 驱动程序版本 2.0.2。

发布了 JDBC 驱动程序新版本 (版本 2.0.2)。有关信息,请参阅 将 Athena 与 JDBC 驱动程序结合使用

2018 年 4 月 19 日

增加自动填写功能,方便用户在 Athena 控制台中键入查询。

增加自动填写功能,方便用户在 Athena 控制台中键入查询。

2018 年 4 月 6 日

增加直接通过 CloudTrail 控制台为 CloudTrail 日志文件创建 Athena 表的功能。

增加直接通过 CloudTrail 控制台自动为 CloudTrail 日志文件创建 Athena 表的功能。有关信息,请参阅 使用 CloudTrail 控制台为 CloudTrail 日志创建 Athena 表

2018 年 3 月 15 日
增加了对使用 GROUP BY 安全地将中间数据卸载到磁盘进行查询的支持。 添加了一种为使用 GROUP BY 子句的内存密集型查询将中间数据安全地卸载到磁盘的功能。这提高了此类查询的可靠性,可防止“Query resource exhausted”错误。有关更多信息,请参阅2018 年 2 月 2 日的发布说明。 2018 年 2 月 2 日
增加了对 Presto 版本 0.172 的支持。 已将 Amazon Athena 中的底层引擎升级到基于 Presto 0.172 版的版本。有关更多信息,请参阅2018 年 1 月 19 日的发布说明。 2018 年 1 月 19 日
增加了对 ODBC 驱动程序的支持。 增加了对将 Athena 连接到 ODBC 驱动程序的支持。有关信息,请参阅使用 ODBC 连接到 Amazon Athena 2017 年 11 月 13 日
增加了对亚太地区 (首尔)、亚太地区 (孟买) 和欧洲 (伦敦) 区域的支持。增加了对查询地理空间数据的支持。 增加了对查询地理空间数据以及对亚太地区 (首尔)、亚太地区 (孟买)、欧洲 (伦敦) 区域的支持。想要了解有关信息,请参阅查询地理空间数据Amazon区域和终端节点. 2017 年 11 月 1 日
增加了对欧洲(法兰克福)的支持。 增加了对欧洲(法兰克福)的支持。有关受支持区域的列表,请参阅Amazon区域和终端节点. 2017 年 10 月 19 日
添加了对使用命名 Athena 查询的支持Amazon CloudFormation. 增加了对使用创建命名 Athena 查询的支持Amazon CloudFormation. 有关更多信息,请参阅 https://docs.amazonaws.cn/AWSCloudFormation/latest/UserGuide/aws-resource-athena-named-query.html 用户指南中的 Amazon CloudFormationCFN::Athena::NamedQuery 2017 年 10 月 3 日
增加了对亚太地区(悉尼)的支持。 增加了对亚太地区(悉尼)的支持。有关受支持区域的列表,请参阅Amazon区域和终端节点. 2017 年 9 月 25 日
在本指南中添加了一个用于查询Amazon服务日志和不同类型的数据,包括映射、数组、嵌套数据和包含 JSON 的数据。 添加了查询 Amazon 服务日志,用于查询 Athena 中的不同类型数据。有关信息,请参阅 使用 Amazon Athena 运行 SQL 查询 2017 年 9 月 5 日
添加了对 Amazon Glue Data Catalog 的支持。 增加了与Amazon Glue Data Catalog和迁移向导,可用于从 Athena 托管的数据目录更新到Amazon Glue Data Catalog. 有关更多信息,请参阅 。与 集成Amazon GlueAmazon Glue. 2017 年 8 月 14 日
增加了对 Grok SerDe 的支持。 增加了对 Grok SerDe 的支持,它为非结构化文本文件 (例如日志) 中的记录添加了更简便的模式匹配。有关更多信息,请参阅 Grok SerDe。添加了键盘快捷键,用于使用控制台滚动查询历史记录。 2017 年 4 月 8 日
增加了对亚太地区(东京)的支持。 增加了对亚太地区(东京)和亚太地区(新加坡)的支持。有关受支持区域的列表,请参阅Amazon区域和终端节点. 2017 年 6 月 22 日
增加了对欧洲(爱尔兰)的支持。 增加了对欧洲(爱尔兰)的支持。有关更多信息,请参阅 Amazon 区域和终端节点 2017 年 6 月 8 日
添加了 Amazon Athena API 和Amazon CLI支持。 添加了 Amazon Athena API 和Amazon CLI对 Athena 的支持。将 JDBC 驱动程序更新到了版本 1.1.0。 2017 年 5 月 19 日
增加了对 Amazon S3 数据加密的支持。 增加了对 Amazon S3 数据加密的支持,并发布了具有加密支持、改进和错误修复的 JDBC 驱动程序更新 (1.0.1 版)。有关更多信息,请参阅静态加密 2017 年 4 月 4 日
增加 Amazon CloudTrail SerDe。 增加 Amazon CloudTrail SerDe、改进性能和解决分区问题。有关更多信息,请参阅CloudTrail SerDe
  • 提高了扫描大量分区时的性能。

  • 提高了 MSCK Repair Table 操作的性能。

  • 增加了查询在主要区域之外的区域存储的 Amazon S3 数据的功能。除了标准 Athena 费用外,Amazon S3 的标准区域间数据传输费率也适用。

2017 年 3 月 24 日
增加了对美国东部(俄亥俄)的支持。 添加了对 的支持Avro SerDe用于处理 CSV 的 OpenCSVSerDe、美国东部(俄亥俄)以及在控制台向导中批量编辑列。改进了大型 Parquet 表的性能。 2017 年 2 月 20 日
首次发布Amazon Athena 用户指南. 2016 年 11 月