文档历史记录 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

文档历史记录

最新文档更新: 2020年9月14日。

我们经常更新文档来处理您的反馈意见。下表介绍 Amazon Athena 文档的重要补充部分。并非所有更新都呈现出来。

更改 Description 发行日期
添加了 Amazon Athena Elasticsearch 数据接头。 有关更多信息,请参阅 Amazon Athena Elasticsearch 连接器。) 2020年7月21日
添加了查询Hudi数据集的文档。 有关更多信息,请参阅 使用 Athena 查询ApacheHudi数据集。) 2020年7月9日
添加了有关查询存储在中的ApacheWeb服务器日志和IISWeb服务器日志的文档 Amazon S3. 有关更多信息,请参阅 查询Apache日志存储在 Amazon S3查询存储在中的Internet信息服务器(IIS)日志 Amazon S3 2020年7月8日
Amazon Athena 用户指南现在支持 Kindle 格式。 Kindle 电子书是免费的。更多信息,请参阅 阿森达尼: 用户指南Kindle版本,或选择 温德尔 在线版 Amazon Athena 用户指南. 2020 年 6 月 18 日
添加了 Athena Data Connector for External Hive Metastore (Preview) 的一般发布版本的文档。 有关更多信息,请参阅 使用 Athena Data Connector for External Hive Metastore (Preview)。) 2020 年 6 月 1 日
添加了有关标记数据目录资源的文档。 有关更多信息,请参阅 标记资源。) 2020 年 6 月 1 日
添加了有关分区投影的文档。 有关更多信息,请参阅 Amazon Athena 中的分区投影。) 2020 年 5 月 21 日
更新了 Athena 的 Java 代码示例。 有关更多信息,请参阅 代码示例。) 2020 年 5 月 11 日
添加了关于查询 Amazon GuardDuty 调查结果的主题。 有关更多信息,请参阅 查询 Amazon GuardDuty 调查结果。) 2020 年 3 月 19 日
添加了关于使用 CloudWatch Events 监控 Athena 查询状态转换的主题。 有关更多信息,请参阅 使用 CloudWatch 事件监控 Athena 查询。) 2020 年 3 月 11 日
添加了有关使用 Athena 查询 AWS Global Accelerator 流日志的主题。 有关更多信息,请参阅 查询 AWS Global Accelerator 流日志。) 2020 年 2 月 6 日
  • 添加了有关将 CTAS 与 INSERT INTO 结合使用以将未分区源中的数据添加到已分区的目标的文档。

  • 添加了适用于 Athena 的 1.1.0 预览版 ODBC 驱动程序的下载链接。

  • 更正了 SHOW DATABASES LIKE 正则表达式的说明。

  • 更正了 CTA 主题中的 partitioned_by 语法。

  • 其他较小的修复。

文档更新包括但不限于以下主题:

2020 年 2 月 4 日
添加了有关将 CTAS 与 INSERT INTO 结合使用以将已分区源中的数据添加到已分区的目标的文档。 有关更多信息,请参阅 使用 CTAS 和 INSERT INTO 创建带 100 多个分区的表。) 2020 年 1 月 22 日
更新了查询结果位置信息。 Athena 不再创建“默认”查询结果位置。有关更多信息,请参阅 指定查询结果位置。) 2020 年 1 月 20 日
添加了有关查询 AWS Glue 数据目录 的主题。更新了有关 Athena 中的服务配额(以前称作“服务限额”)的信息。 有关更多信息,请参阅以下主题: 2020 年 1 月 17 日
更正了有关 OpenCSVSerDe 的主题,以说明应以 UNIX 数字格式指定 TIMESTAMP 类型。 有关更多信息,请参阅 用于处理 CSV 的 OpenCSVSerDe。) 2020 年 1 月 15 日
更新了有关加密的安全主题,以说明 Athena 不支持非对称密钥。

Athena 仅支持读取和写入数据的对称密钥。

有关更多信息,请参阅 支持的 Amazon S3 加密选项。)
2020 年 1 月 8 日
添加了有关对使用自定义 AWS KMS 密钥加密的 Amazon S3 存储桶进行跨账户访问的信息。 有关更多信息,请参阅 跨账户访问使用自定义 AWS KMS 密钥加密的存储桶。) 2019 年 12 月 13 日

添加了有关联合查询、外部 Hive 元存储、机器学习和用户定义的函数的文档。添加了新的 CloudWatch 指标。

有关更多信息,请参阅以下主题: 2019 年 11 月 26 日
增加了有关新 INSERT INTO 命令的部分,并更新了查询结果位置信息以支持数据清单文件。 有关更多信息,请参阅 INSERT INTO使用查询结果、输出文件和查询历史记录 2019 年 9 月 18 日

增加了有关接口 VPC 终端节点 (PrivateLink) 支持的部分。更新了 JDBC 驱动程序。更新了有关丰富的 VPC 流日志的信息。

有关更多信息,请参阅使用接口 VPC 终端节点连接到 Amazon Athena查询 Amazon VPC 流日志将 Athena 与 JDBC 驱动程序结合使用

2019 年 9 月 11 日

增加了与 AWS Lake Formation 集成的部分。

有关更多信息,请参阅 使用 Athena 查询向 AWS Lake Formation 注册的数据。)

2019 年 6 月 12 日

更新了与其他 AWS 服务保持一致性的“安全性”部分。

有关更多信息,请参阅 Amazon Athena 安全性。)

2019 年 6 月 12 日

增加了有关查询 AWS WAF 日志的部分。

有关更多信息,请参阅 查询 AWS WAF 日志。)

2019 年 5 月 31 日

发布新版本的 ODBC 驱动程序,支持 Athena 工作组。

要下载 ODBC 驱动程序版本 1.0.5 及其文档,请参阅使用 ODBC 连接到 Amazon Athena。在工作组上使用标签时,对 ODBC 驱动程序连接字符串没有更改。要使用标签,请将 ODBC 驱动程序升级到最新版本,即此当前版本。

此驱动程序版本可让您使用 Athena API 工作组操作来创建和管理工作组,使用 Athena API 标签操作来添加、列出或删除工作组上的标签。在您开始之前,请确保您在 IAM 中拥有资源级别的权限以对工作组和标签执行操作。

2019 年 3 月 5 日
Amazon Athena 中添加了工作组的标签支持。

标签包含您定义的一个键和一个值。您在标记工作组时,将为其分配自定义元数据。例如,为每个成本中心创建一个工作组。然后,通过将标签添加到这些组,您可以跟踪每个成本中心的 Athena 支出。更多信息,请参阅 使用标签进行开票AWS Billing and Cost Management 用户指南.

2019 年 2 月 22 日
改进了 Athena 中使用的 JSON OpenX SerDe。

这些改进包括但不限于以下内容:

  • 支持 ConvertDotsInJsonKeysToUnderscores 属性。设置为 TRUE 时,它允许 SerDe 使用下划线替换键名称中的点。例如,如果 JSON 数据集包含名为 "a.b" 的键,您可以在 Athena 中使用此属性来定义列名 "a_b"。默认值为 FALSE。默认情况下, Athena 不允许在列名称中使用点。

  • 支持 case.insensitive 属性。默认情况下,Athena 要求 JSON 数据集中的所有键使用小写。使用 WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) 允许您在数据中使用区分大小写的键名。默认值为 TRUE。当设置为 TRUESerDe将所有大写字母转换为小写。

有关更多信息,请参阅 OpenX JSON SerDe。)

2019 年 2 月 18 日
添加对工作组的支持。

可使用工作组分隔用户、团队、应用程序或工作负载,并对每个查询或整个工作组可处理的数据量设置限制。由于工作组用作 IAM 资源,所以您可以使用资源级别的权限来控制对特定工作组的访问。您还可以在 Amazon CloudWatch 中查看与查询相关的指标、通过配置扫描的数据量限制来控制查询成本、创建阈值以及在突破这些阈值时触发操作,例如 Amazon SNS 警报。有关更多信息,请参阅 使用工作组运行查询使用 CloudWatch 指标和事件控制成本和监控查询

2019 年 2 月 18 日
增加了对分析来自 网络负载均衡器 的日志的支持。

增加了用于分析来自 网络负载均衡器 的日志的示例 Athena 查询。这些日志将接收有关发送到 网络负载均衡器 的传输层安全性 (TLS) 请求的详细信息。您可以使用这些访问日志分析流量模式并解决问题。有关信息,请参阅查询 网络负载均衡器 日志

2019 年 1 月 24 日

发布了 JDBC 和 ODBC 驱动程序的新版本,支持通过 AD FS 和 SAML 2.0 (安全断言标记语言 2.0)对 Athena API 的联合访问。

在此驱动程序版本中,Active Directory 联合身份验证服务 (AD FS 3.0) 支持对 Athena 的联合访问。访问通过支持 SAML 2.0 的 JDBC 或 ODBC 驱动程序版本建立。有关配置对 Athena API 联合访问的信息,请参阅启用对 Athena API 的联合身份访问

2018 年 11 月 10 日

添加了对 Athena 中数据库和表的精细访问控制支持。此外,在 Athena 中添加了策略,允许您在 Data Catalog中加密数据库和表元数据。

添加了对创建对 AWS Glue 数据目录 中的资源(如 Athena 中使用的数据库和表)提供精细访问控制的基于身份的 (IAM) 策略的支持。

此外,您可以通过将特定策略添加到 Athena,在 Data Catalog中加密数据库和表元数据。

有关详细信息,请参阅 针对 AWS Glue 数据目录 中数据库和表的精细访问权限

2018 年 10 月 15 日
增加了对 CREATE TABLE AS SELECT 语句的支持。

文档中有了其他改进。

增加了对 CREATE TABLE AS SELECT 语句的支持。请参阅从查询结果创建表注意事项和限制以及示例

2018 年 10 月 10 日

发行 ODBC 驱动程序版本 1.0.3,此版本具有对流式处理结果的支持而不是在页面中提取这些结果。

文档中有了其他改进。

ODBC 驱动程序版本 1.0.3 支持流式处理结果,并包括了改进、错误修复以及对“将 SSL 与代理服务器结合使用” 的文档更新。

有关下载 ODBC 驱动程序版本 1.0.3 及其文档的信息,请参阅使用 ODBC 连接到 Amazon Athena

2018 年 9 月 6 日

发行 JDBC 驱动程序版本 2.0.5,此版本具有对流式处理结果的默认支持而不是在页面中提取这些结果。

文档中有了其他改进。

发行 JDBC 驱动程序 2.0.5,此版本具有对流式处理结果的默认支持而不是在页面中提取这些结果。有关信息,请参阅将 Athena 与 JDBC 驱动程序结合使用

2018 年 8 月 16 日

更新了查询 Amazon Virtual Private Cloud 流日志的文档,流日志可直接以 GZIP 格式存储在 Amazon S3 中。

更新了查询 ALB 日志的示例。

更新了查询 Amazon Virtual Private Cloud 流日志的文档,流日志可直接以 GZIP 格式存储在 Amazon S3 中。有关信息,请参阅查询 Amazon VPC 流日志

更新了查询 ALB 日志的示例。有关信息,请参阅查询 Application Load Balancer 日志

2018 年 8 月 7 日
添加了对视图的支持。添加了各种数据存储格式的架构操作指南。

添加了对视图的支持。有关信息,请参阅使用视图

更新了此指南中有关如何处理各种数据存储格式的架构更新的指导。有关信息,请参阅处理架构更新

2018 年 5 月 6 日
默认查询并发限制从 5 个提高到 20 个。

您可以同时提交并运行最多 20 个 DDL 查询和 20 个 SELECT 查询。有关信息,请参阅Service Quotas

2018 年 5 月 17 日
增加了查询选项卡,并支持用户在查询编辑器中配置自动完成功能。

增加了查询选项卡,并支持用户在查询编辑器中配置自动完成功能。有关信息,请参阅使用控制台

2018 年 5 月 8 日
发布了 JDBC 驱动程序版本 2.0.2。

发布了 JDBC 驱动程序新版本 (版本 2.0.2)。有关信息,请参阅将 Athena 与 JDBC 驱动程序结合使用

2018 年 4 月 19 日

增加自动填写功能,方便用户在 Athena 控制台中键入查询。

增加自动填写功能,方便用户在 Athena 控制台中键入查询。

2018 年 4 月 6 日

增加直接通过 CloudTrail 控制台为 CloudTrail 日志文件创建 Athena 表的功能。

增加直接通过 CloudTrail 控制台为 CloudTrail 日志文件自动创建 Athena 表的功能。有关信息,请参阅使用 CloudTrail 控制台为 CloudTrail 日志创建 Athena 表

2018 年 3 月 15 日
增加了对使用 GROUP BY 安全地将中间数据卸载到磁盘进行查询的支持。 添加了一种为使用 GROUP BY 子句的内存密集型查询将中间数据安全地卸载到磁盘的功能。这提高了此类查询的可靠性,防止了 "Query resource exhausted" errors 有关更多信息,请参阅2018 年 2 月 2 日的发布说明。 2018 年 2 月 2 日
增加了对 Presto 版本 0.172 的支持。 已将 Amazon Athena 中的底层引擎升级到基于 Presto 0.172 版的版本。有关更多信息,请参阅2018 年 1 月 19 日的发布说明。 2018 年 1 月 19 日
增加了对 ODBC 驱动程序的支持。 增加对将 Athena 连接到 ODBC 驱动程序的支持。有关信息,请参阅使用 ODBC 连接到 Amazon Athena 2017 年 11 月 13 日
增加对 亚太区域(首尔)、亚太地区(孟买) 和 欧洲(伦敦) 区域的支持。增加了对查询地理空间数据的支持。 增加对查询地理空间数据以及对 亚太区域(首尔)、亚太地区(孟买) 和 欧洲(伦敦) 区域的支持。有关信息,请参阅查询地理空间数据AWS 区域和终端节点 2017 年 11 月 1 日
增加了对 欧洲(法兰克福) 的支持 增加了对 欧洲(法兰克福) 的支持 有关受支持区域的列表,请参阅 AWS 区域和终端节点 2017 年 10 月 19 日
增加对使用 AWS CloudFormation 进行命名 Athena 查询的支持。 增加对使用 AWS CloudFormation 创建命名 Athena 查询的支持。有关更多信息,请参阅 https://docs.amazonaws.cn/AWSCloudFormation/latest/UserGuide/aws-resource-athena-named-query.html 用户指南中的 AWS CloudFormationCFN::Athena::NamedQuery 2017 年 10 月 3 日
增加了对 亚太区域(悉尼) 的支持 增加了对 亚太区域(悉尼) 的支持 有关受支持区域的列表,请参阅 AWS 区域和终端节点 2017 年 9 月 25 日
在本指南中添加了一节,用于查询 AWS 服务日志和不同类型的数据,包括映射、数组、嵌套数据和包含 JSON 的数据。 增加 查询 AWS 服务日志 的示例以及在 Athena 中查询不同类型数据的示例。有关信息,请参阅使用 Amazon Athena 运行 SQL 查询 2017 年 9 月 5 日
增加了对 AWS Glue 数据目录 的支持 增加与 AWS Glue 数据目录 的集成以及用于从 Athena 托管数据目录更新到 AWS Glue 数据目录 的迁移向导。有关更多信息,请参阅与 AWS Glue 集成AWS Glue 2017 年 8 月 14 日
增加了对 Grok SerDe 的支持。 增加了对 Grok SerDe 的支持,它为非结构化文本文件 (例如日志) 中的记录添加了更简便的模式匹配。有关更多信息,请参阅 Grok SerDe。增加了键盘快捷键,用以通过控制台滚动查看查询历史记录(使用 Windows 时为 Ctrl + ???/???,使用 Mac 时为 CMD + ???/???)。 2017 年 4 月 8 日
增加了对 亚太区域(东京) 的支持 添加了对 亚太区域(东京) 和 亚太区域(新加坡) 的支持。有关受支持区域的列表,请参阅 AWS 区域和终端节点 2017 年 6 月 22 日
增加了对 欧洲(爱尔兰) 的支持 增加了对 欧洲(爱尔兰) 的支持 有关更多信息,请参阅 AWS 区域和终端节点 2017 年 6 月 8 日
增加 Amazon Athena API 和 AWS CLI 支持。 增加对 Athena 的 Amazon Athena API 和 AWS CLI 支持。将 JDBC 驱动程序更新到了版本 1.1.0。 2017 年 5 月 19 日
增加对 Amazon S3 数据加密的支持。 增加对 Amazon S3 数据加密的支持,并发行具有加密支持、改进和错误修复的 JDBC 驱动程序更新(1.0.1 版)。有关更多信息,请参阅 静态加密。) 2017 年 4 月 4 日
增加 AWS CloudTrail SerDe。 增加 AWS CloudTrail SerDe、改进性能和解决分区问题。有关更多信息,请参阅 CloudTrail SerDe。)
  • 提高了扫描大量分区时的性能。

  • 提高了 MSCK Repair Table 操作的性能。

  • 增加查询存储在主要区域之外的区域中的 Amazon S3 数据的功能。除了标准 Athena 费用外,Amazon S3 的标准区域间数据传输费率也适用。

2017 年 3 月 24 日
增加了对 美国东部(俄亥俄州) 的支持 增加了对 Avro SerDe用于处理 CSV 的 OpenCSVSerDe、美国东部(俄亥俄州)以及在控制台向导中批量编辑列的支持。改进了大型 Parquet 表的性能。 2017 年 2 月 20 日
首次发布 Amazon Athena 用户指南 2016 年 11 月