Amazon EMR 7.5.0:Hadoop 发布说明 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon EMR 7.5.0:Hadoop 发布说明

Amazon EMR 7.5.0:Hadoop 更改

类型 描述

错误修复

将 fs.file.impl 注释为空值。

逆向移植

HADOOP-19286:设置 S3 区域/端点时支持 S3A 跨区域访问

改进

EMR-EC2 上 S3A 连接器的自动 S3 区域配置设置

改进

减少 S3A 中的 HeadObject 调用数

随着 Amazon EMR 7.5 的发布,Spark 的 S3A 连接器展现出与 EMRFS 相当的读取性能,使用 3TB TPC-DS parquet 数据集的基准测试证明了这一点。

Amazon EMR 7.5.0:Hadoop 功能

  • S3 区域配置 fs.s3a.endpoint.region 会自动设置为使用 S3A 连接器启动 EMR 集群以进行 EMR-EC2 部署的区域。

  • S3A 连接器默认启用 Amazon S3 跨存储桶区域访问。可以通过设置 fs.s3a.cross.region.access.enabled=true or false 来对其进行修改。