Amazon EMR 7.2.0:Hadoop 发布说明
Amazon EMR 7.2.0:Hadoop 更改
| 类型 | 描述 |
|---|---|
|
新功能 |
HADOOP-18850 |
|
新功能 |
支持 S3 Glacier 读取还原的对象 |
|
改进 |
运行 Spark 作业时,根据内核动态扩展 S3A 最大连接数 |
|
改进 |
HADOOP-18797 |
|
改进 |
HADOOP-19047 |
|
改进 |
在 MagicV2 Committer 中添加 "Export"、"Publish" 和 "AbortPublish" 方法 |
|
改进 |
在 S3A 中实现 ReadFullyIntoBuffers 文件系统 API |
|
错误修复 |
HADOOP-18793 |
|
Upgrade |
HADOOP-19008 |
|
Upgrade |
HADOOP-18613 |
Amazon EMR 7.2.0:Hadoop 功能
有关 Amazon EMR 7.2.0 中的 Hadoop 新功能,请参阅以下列表。
-
S3 glacier 支持读取还原的对象:在 Amazon EMR 7.2.0 及更高版本中,您可以使用
S3A协议从表的 S3 位置读取还原的 Glacier 对象。如果存档的 Glacier 文件仍在还原中,则此读取操作将忽略这些文件。 -
使用 S3A magic committer 支持并发写入:Amazon EMR 7.2.0 引入了对 S3A magic committer 并发写入的支持。此功能已作为 HADOOP-18797
的一部分添加到 OSS Hadoop 社区。