

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# Amazon EMR 6.8.0：Hive 发布说明
<a name="Hive-release-history-680"></a>

## Amazon EMR 6.8.0：Hive 更改
<a name="Hive-release-history-changes-680"></a>


| Type | 说明 | 
| --- | --- | 
| 改进 | 减少 msck 命令中的文件系统调用。性能改进（在 10k 以上的分区上提高约 15-20 倍） | 
| 逆向移植 | [HIVE-20678](https://issues.apache.org/jira/browse/HIVE-20678)：Hive HBase TableOutputFormat 应实施 HiveOutputFormat 以确保兼容性 | 
| 逆向移植 | [HIVE-21040](https://issues.apache.org/jira/browse/HIVE-21040)：msck 在目录树的最后一级列出不必要的文件 | 
| 逆向移植 | [HIVE-21460](https://issues.apache.org/jira/browse/HIVE-21460)：加载数据后再进行 select \$1 查询会导致结果不正确 | 
| 逆向移植 | [HIVE-21660](https://issues.apache.org/jira/browse/HIVE-21660)：当使用 union all 和 later with explode 时结果错误 | 
| 逆向移植 | [HIVE-22505](https://issues.apache.org/jira/browse/HIVE-22505)：由 ClassCastException 错误的矢量化运算符选择引起 | 
| 逆向移植 | [HIVE-22513](https://issues.apache.org/jira/browse/HIVE-22513)：过滤器运算中强制转换列的持续传播可能会导致不正确的结果 | 
| 逆向移植 | [HIVE-23435](https://issues.apache.org/jira/browse/HIVE-23435)：完整的外部联接结果缺少行 | 
| 逆向移植 | [HIVE-24209](https://issues.apache.org/jira/browse/HIVE-24209)：启用向量化时，NOT BETWEEN 运算的搜索参数转换不正确 | 
| 逆向移植 | [HIVE-24934](https://issues.apache.org/jira/browse/HIVE-24934)：通用UDFSQCount检查中不需要 VectorizedExpressions 注释 | 
| 逆向移植 | [HIVE-25278](https://issues.apache.org/jira/browse/HIVE-25278)： HiveProjectJoinTransposeRule 可能使用窗口表达式进行无效的转换 | 
| 逆向移植 | [HIVE-25505](https://issues.apache.org/jira/browse/HIVE-25505)：如果第一行为空，则 header. skip.header.line.count 的结果不正确 | 
| 逆向移植 | [HIVE-26080](https://issues.apache.org/jira/browse/HIVE-26080)：将 accumulo-core 升级到 1.10.1 | 
| 逆向移植 | [HIVE-26235](https://issues.apache.org/jira/browse/HIVE-26235)：二进制列上的 OR 条件返回空结果 | 
| Bug | 修复启动期间 stderr 中的多个 SLF4 J 绑定警告日志 | 
| Bug | 修复当分区和表位于不同文件系统时 SHOW TABLE EXTENDED 查询失败并出现 Wrong FS 错误的问题。 | 

## Amazon EMR 6.8.0：Hive 已知问题
<a name="emr-Hive-680-issues"></a>
+ 在 6.6.0 到 6.9.x 版 Amazon EMR 中，带有动态分区和 ORDER BY 或 SORT BY 子句的 INSERT 查询将始终具有两个 Reducer。此问题是由于 OSS 更改 [HIVE-20703](https://issues.apache.org/jira/browse/HIVE-20703) 所致，该更改将动态排序分区优化置于基于成本的决策之下。如果您的工作负载不需要对动态分区进行排序，建议将 `hive.optimize.sort.dynamic.partition.threshold` 属性设置为 `-1` 以禁用新功能并获得计算正确的 Reducer 数量。此问题已作为 [HIVE-22269](https://issues.apache.org/jira/browse/HIVE-22269) 的一部分在 OSS Hive 中修复，并已在 Amazon EMR 6.10.0 中修复。