亚马逊 EMR 7.5.0-Hadoop 发行说明 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 EMR 7.5.0-Hadoop 发行说明

亚马逊 EMR 7.5.0-Hadoop 变更

类型 描述

错误修复

将 fs.file.impl 注释为空值。

逆向移植

HADOOP-19286:设置 S3 区域/终端节点后支持 S3A 跨区域访问

改进

EMR 上的 S3A 连接器的自动 S3 区域配置设置 EC2

改进

减少 S3A 中的 HeadObject 通话次数

随着Amazon EMR 7.5的发布,Spark的S3A连接器的读取性能与EMRFS相当,使用3TB TPC-DS镶木地板数据集的基准测试就证明了这一点。

亚马逊 EMR 7.5.0-Hadoop 功能

  • S3 区域配置fs.s3a.endpoint.region会自动设置为使用 S3A 连接器启动 EMR 集群的区域,用于部署 EMR。EC2

  • 默认情况下,S3A 连接器已启用 Amazon S3 跨存储桶区域访问权限。可以通过设置进行修改fs.s3a.cross.region.access.enabled=true or false