本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon EMR 7.6.0:Hive 发布说明
Amazon EMR 7.6.0:Hive 更改
| Type | 说明 |
|---|---|
改进 |
为 ORC 非 ACID 分区表添加了快速 S3 前缀列表功能 |
功能 |
在 S3 系统上添加对 Hive 写入查询的 Magic Committers 的支持 AFile |
已知问题
对于以 Amazon S3 Express One Zone 为输出位置的 Hive 插入覆盖查询,请将 core-site 配置:
fs.s3a.directory.operations.purge.uploads设置为false。
Amazon EMR 7.6.0 - 新配置
| 分类 | Name | 默认值 | 说明 |
|---|---|---|---|
hive-site |
|
true |
是否使用快速 S3 分区发现进行拆分计算。这将为支持的文件格式启用基于前缀的列表:ORC。请注意,此功能使用 S3 Express One Zone 存储类别不支持的 S3 API 参数。使用它们时,请禁用此功能。 |
hive-site |
|
128 |
快速 S3 分区发现的最大并行度。 |
hive-site |
|
10 |
快速 S3 分区发现单次运行的并行度。此配置只有在 |
hive-site |
|
true |
用于切换 Magic 提交程序和 Hive 的标志是否应该跟踪内存中所有待处理提交? Magic 提交者可以选择将提交数据存储在内存中,这样可以减少调用 S3 的次数,从而加快 TaskCommit 操作速度。此配置会覆盖 Hadoop 配置 |
hive-site |
|
true |
用于切换 Magic 提交程序的标志是否应该在 blobstore 中创建 dp 暂存路径? 此标志仅适用于 Hive 通过 |
hive-site |
|
true |
使用 Magic Committer 时,应在 LLAP 的写入流中禁用用于切换 blobstore FS 缓存的标志。启用 LLAP 时,此标志就会生效,默认情况下设置为 true。 |