2019 年 2 月 18 日 - Amazon Athena
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

如果我们为英文版本指南提供翻译,那么如果存在任何冲突,将以英文版本指南为准。在提供翻译时使用机器翻译。

2019 年 2 月 18 日

发布时间:2019 年 02 月 18 日

添加了通过在工作组中运行查询来控制成本的功能。有关信息,请参阅使用工作组控制查询访问和成本。改进了在 Athena 中使用的 JSON OpenX SerDe,修复了 Athena 不忽略转换为 GLACIER 存储类别的对象的问题,并添加了用于查询 网络负载均衡器 日志的示例。

进行了以下更改:

  • 添加对工作组的支持。可使用工作组分隔用户、团队、应用程序或工作负载,并对每个查询或整个工作组可处理的数据量设置限制。由于工作组用作 IAM 资源,所以您可以使用资源级别的权限来控制对特定工作组的访问。您还可以在 Amazon CloudWatch 中查看与查询相关的指标、通过配置扫描的数据量限制来控制查询成本、创建阈值以及在突破这些阈值时触发操作,例如 Amazon SNS 警报。有关更多信息,请参阅 使用工作组运行查询使用 CloudWatch 指标和事件控制成本和监控查询

    工作组是 IAM 资源。有关工作组相关操作、资源和条件的完整列表 IAM,见 行动、资源和alirocumab的条件要素IAM 用户指南. 创建新的工作组之前,请确保您使用的是工作组 IAM 策略AmazonAthenaFullAccess 托管策略

    您可以在控制台中、通过工作组 API 操作或通过 JDBC 驱动程序开始使用工作组。有关高级过程,请参阅设置工作组。要下载具有工作组支持的 JDBC 驱动程序,请参阅将 Athena 与 JDBC 驱动程序结合使用

    如果您将工作组与 JDBC 驱动程序结合使用,则必须使用 Workgroup 配置参数在连接字符串中设置工作组名称,如下面的示例所示:

    jdbc:awsathena://AwsRegion=<AWSREGION>;UID=<ACCESSKEY>; PWD=<SECRETKEY>;S3OutputLocation=s3://<athena-output>-<AWSREGION>/; Workgroup=<WORKGROUPNAME>;

    您运行 SQL 语句或者对驱动程序进行 JDBC API 调用的方式没有更改。驱动程序将工作组名称传递到 Athena。

    有关工作组引入的区别的信息,请参阅 Athena 工作组 API工作组故障排除

  • 改进了 Athena 中使用的 JSON OpenX SerDe。这些改进包括但不限于以下内容:

    • 支持 ConvertDotsInJsonKeysToUnderscores 属性。设置为 TRUE 时,它允许 SerDe 使用下划线替换键名称中的点。例如,如果 JSON 数据集包含名为 "a.b" 的键,您可以在 Athena 中使用此属性来定义列名 "a_b"。默认值为 FALSE。默认情况下, Athena 不允许在列名称中使用点。

    • 支持 case.insensitive 属性。默认情况下,Athena 要求 JSON 数据集中的所有键使用小写。使用 WITH SERDE PROPERTIES ("case.insensitive"= FALSE;) 允许您在数据中使用区分大小写的键名。默认值为 TRUE。当设置为 TRUESerDe将所有大写字母转换为小写。

    有关更多信息,请参阅 OpenX JSON SerDe。)

  • 修复了 Athena 在处理由 Amazon S3 生命周期策略存档到 Glacier 中的 Amazon S3 对象时,返回 "access denied" 错误消息的问题。作为修复此问题的结果,Athena 忽略转换为 GLACIER 存储类别的对象。Athena 不支持从 GLACIER 存储类别查询数据。

    更多信息,请参阅 Athena 中的表和 Amazon S3 中的数据的要求转入GLACIER存储类别(对象存档) Amazon Simple Storage Service 开发人员指南.

  • 添加了查询 网络负载均衡器 访问日志的示例,该日志接收有关传输层安全性 (TLS) 请求的信息。有关更多信息,请参阅 查询 网络负载均衡器 日志。)