Amazon EMR 7.5.0:Hadoop 发布说明
Amazon EMR 7.5.0:Hadoop 更改
| 类型 | 描述 |
|---|---|
|
错误修复 |
将 fs.file.impl 注释为空值。 |
|
逆向移植 |
HADOOP-19286 |
|
改进 |
EMR-EC2 上 S3A 连接器的自动 S3 区域配置设置 |
|
改进 |
减少 S3A 中的 HeadObject 调用数 |
随着 Amazon EMR 7.5 的发布,Spark 的 S3A 连接器展现出与 EMRFS 相当的读取性能,使用 3TB TPC-DS parquet 数据集的基准测试证明了这一点。
Amazon EMR 7.5.0:Hadoop 功能
-
S3 区域配置
fs.s3a.endpoint.region会自动设置为使用 S3A 连接器启动 EMR 集群以进行 EMR-EC2 部署的区域。 S3A 连接器默认启用 Amazon S3 跨存储桶区域访问。可以通过设置
fs.s3a.cross.region.access.enabled=来对其进行修改。true or false