6.0.0 应用程序版本 6.0.0 发布说明 6.0.0 组件版本 6.0.0 配置分类

Amazon EMR 发行版 6.0.0

6.0.0 应用程序版本

此版本包括以下应用程序：Ganglia、HBase、HCatalog、Hadoop、Hive、Hudi、Hue、JupyterHub、Livy、MXNet、Oozie、Phoenix、Presto、Spark、TensorFlow、Tez、Zeppelin 和 ZooKeeper。

下表列出了此版本的 Amazon EMR 中提供的应用程序版本以及前三个 Amazon EMR 发行版中的应用程序版本（若适用）。

有关每个发行版的 Amazon EMR 的应用程序版本的全面历史记录，请参见以下主题：

应用程序版本信息
	emr-6.1.1	emr-6.1.0	emr-6.0.1	emr-6.0.0
Amazon 适用于 Java 的 SDK	1.11.828	1.11.828	1.11.711	1.11.711
Python	2.7、3.7	2.7、3.7	2.7、3.7	2.7、3.7
Scala	2.12.10	2.12.10	2.12.10	2.11.12
AmazonCloudWatchAgent	-	-	-	-
Delta	-	-	-	-
Flink	1.11.0	1.11.0	-	-
Ganglia	3.7.2	3.7.2	3.7.2	3.7.2
HBase	2.2.5	2.2.5	2.2.3	2.2.3
HCatalog	3.1.2-amzn-2	3.1.2-amzn-2	3.1.2-amzn-0	3.1.2-amzn-0
Hadoop	3.2.1-amzn-1.1	3.2.1-amzn-1	3.2.1-amzn-0.1	3.2.1-amzn-0
Hive	3.1.2-amzn-2	3.1.2-amzn-2	3.1.2-amzn-0	3.1.2-amzn-0
Hudi	0.5.2-incubating-amzn-2	0.5.2-incubating-amzn-2	0.5.0-incubating-amzn-1	0.5.0-incubating-amzn-1
Hue	4.7.1	4.7.1	4.4.0	4.4.0
Iceberg	-	-	-	-
JupyterEnterpriseGateway	-	-	-	-
JupyterHub	1.1.0	1.1.0	1.0.0	1.0.0
Livy	0.7.0-incubating	0.7.0-incubating	0.6.0-incubating	0.6.0-incubating
MXNet	1.6.0	1.6.0	1.5.1	1.5.1
Mahout	-	-	-	-
Oozie	5.2.0	5.2.0	5.1.0	5.1.0
Phoenix	5.0.0-HBase-2.0	5.0.0-HBase-2.0	5.0.0-HBase-2.0	5.0.0-HBase-2.0
Pig	0.17.0	0.17.0	-	-
Presto	0.232	0.232	0.230	0.230
Spark	3.0.0-amzn-0.1	3.0.0-amzn-0	2.4.4	2.4.4
Sqoop	1.4.7	1.4.7	-	-
TensorFlow	2.1.0	2.1.0	1.14.0	1.14.0
Tez	0.9.2	0.9.2	0.9.2	0.9.2
Trino (PrestoSQL)	338	338	-	-
Zeppelin	0.9.0-preview1	0.9.0-preview1	0.9.0-SNAPSHOT	0.9.0-SNAPSHOT
ZooKeeper	3.4.14	3.4.14	3.4.14	3.4.14

6.0.0 发布说明

以下发布说明包括有关 Amazon EMR 发行版 6.0.0 的信息。

首次发布日期：2020 年 3 月 10 日

受支持的应用程序

适用于 Java 的 Amazon SDK 版本 1.11.711
Ganglia 3.7.2
Hadoop 3.2.1
HBase 2.2.3
HCatalog 3.1.2
Hive 3.1.2
Hudi 0.5.0-incubating
Hue 4.4.0
JupyterHub 版本 1.0.0
Livy 0.6.0
MXNet 1.5.1
Oozie 5.1.0
Phoenix 5.0.0
Presto 0.230
Spark 2.4.4
TensorFlow 版本 1.14.0
Zeppelin 0.9.0-SNAPSHOT
Zookeeper 3.4.14
连接器和驱动程序：DynamoDB 连接器 4.14.0

注意

Flink、Sqoop、Pig 和 Mahout 在 Amazon EMR 6.0.0 中不可用。

新特征

YARN Docker 运行时支持 - YARN 应用程序（例如 Spark 作业）现在可以在 Docker 容器的上下文中运行。这可让您轻松定义 Docker 镜像中的依赖项，而无需在 Amazon EMR 集群上安装自定义库。有关更多信息，请参阅配置 Docker 集成和使用 Amazon EMR 6.0.0 通过 Docker 运行 Spark 应用程序。
Hive LLAP 支持 - Hive 现在支持 LLAP 执行模式以提高查询性能。有关更多信息，请参阅使用 Hive LLAP。

更改、增强功能和解决的问题

此版本旨在修复 Amazon EMR Scaling 无法成功缩 up/scale 减集群规模或导致应用程序故障时出现的问题。
修复了当 Amazon EMR 集群上的进程守护程序正在进行运行状况检查活动（例如收集 YARN 节点状态和 HDFS 节点状态）时，针对高利用率的大型集群的扩展请求失败的问题。之所以发生这种情况，是因为集群上的进程守护程序无法将节点的运行状况数据传递给内部 Amazon EMR 组件。
改进了 EMR 集群上的进程守护程序，以便在重用 IP 地址时正确跟踪节点状态，从而提高扩缩操作期间的可靠性。
SPARK-29683。修复了集群缩容期间出现任务失败的问题，因为 Spark 假设所有可用节点都被拒绝列出。
YARN-9011。修复了集群尝试向上或向下扩展时，由于 YARN 停用中的争用条件而导致任务失败的问题。
通过确保集群上的 Amazon EMR 守护程序和之间的节点状态始终保持一致，修复了集群扩展期间步骤或任务失败的问题。 YARN/HDFS
修复了已启用 Kerberos 身份验证的 Amazon EMR 集群的诸如缩减和步骤提交等集群操作失败的问题。这是因为集群上的 Amazon EMR 守护程序没有续订 Kerberos 票证，而在主节点上运行时需要续订 Kerberos 票证。 HDFS/YARN
较新的 Amazon EMR 发行版修复了 Amazon EMR 中较早版本的 AL2 上“最大打开文件数”限制较低的问题。Amazon EMR 发行版 5.30.1、5.30.2、5.31.1、5.32.1、6.0.1、6.1.1、6.2.1、5.33.0、6.3.0 及更高版本现在用更高的“最大打开文件数”设置永久修复了此问题。
Amazon Linux
- Amazon Linux 2 是 EMR 6.x 发布版本系列的操作系统。
- 使用 systemd 进行服务管理，而 Amazon Linux 1 中使用的是 upstart。
Java 开发工具包 (JDK)
- Coretto JDK 8 是 EMR 6.x 版本系列的默认 JDK。
Scala
- Scala 2.12 与 Apache Spark 和 Apache Livy 一起使用。
Python 3
- Python 3 现在是 EMR 中的默认 Python 版本。
YARN 节点标注
- 从 Amazon EMR 6.x 发行版系列开始，默认情况下禁用 YARN 节点标注功能。默认情况下，应用程序主进程可以在核心节点和任务节点上运行。您可以通过配置以下属性来启用 YARN 节点标注功能：yarn.node-labels.enabled 和 yarn.node-labels.am.default-node-label-expression。有关更多信息，请参阅了解主节点、核心节点和任务节点。

已知问题

较早版本的 AL2 上“最大打开文件数”限制较低[此问题已在较新的发行版中修复]。Amazon EMR 发行版 emr-5.30.x、emr-5.31.0、emr-5.32.0、emr-6.0.0、emr-6.1.0 和 emr-6.2.0 基于较早版本的 Amazon Linux 2（AL2）。使用原定设置 AMI 创建 Amazon EMR 集群时，这些版本的“最大打开文件数”ulimit 设置较低。Amazon EMR 发行版 5.30.1、5.30.2、5.31.1、5.32.1、6.0.1、6.1.1、6.2.1、5.33.0、6.3.0 及更高版本使用更高的“最大打开文件数”设置永久修复了此问题。如果使用打开文件数限制较低的发行版，会在提交 Spark 任务时导致“Too many open files”（打开的文件过多）错误。在受影响的发行版中，Amazon EMR 原定设置 AMI 的原定设置“最大打开文件数”ulimit 为 4096，而最新版 Amazon Linux 2 AMI 中的文件限制数为 65536。Spark 驱动程序和执行程序尝试打开超过 4096 个文件时，“打开的最大文件数”的较低 ulimit 设置会导致 Spark 任务失败。要修复此问题，Amazon EMR 使用一个引导操作（BA）脚本，用于在创建集群时调整 ulimit 设置。

如果您使用没有永久修复此问题的较早版本的 Amazon EMR，则可以通过下面的解决方法，显式将实例控制器 ulimit 设置为最多 65536 个文件。
从命令行显式设置 ulimit
1. 编辑 /etc/systemd/system/instance-controller.service，将以下参数添加到 Service (服务) 部分。
  
  LimitNOFILE=65536
  
  LimitNPROC=65536
2. 重启 InstanceController
  
  $ sudo systemctl daemon-reload
  
  $ sudo systemctl restart instance-controller
使用引导操作 (BA) 设置 ulimit

您还可以在创建集群时使用引导操作（BA）脚本将实例控制器 ulimit 配置为 65536 个文件。
```
#!/bin/bash
for user in hadoop spark hive; do
sudo tee /etc/security/limits.d/$user.conf << EOF
$user - nofile 65536
$user - nproc 65536
EOF
done
for proc in instancecontroller logpusher; do
sudo mkdir -p /etc/systemd/system/$proc.service.d/
sudo tee /etc/systemd/system/$proc.service.d/override.conf << EOF
[Service]
LimitNOFILE=65536
LimitNPROC=65536
EOF
pid=$(pgrep -f aws157.$proc.Main)
sudo prlimit --pid $pid --nofile=65535:65535 --nproc=65535:65535
done
sudo systemctl daemon-reload
```
Spark 交互式外壳 PySpark，包括 SparkR 和 spark-shell，不支持将 Docker 与其他库一起使用。
要在 Amazon EMR 6.0.0 中使用 Python 3，您必须在 yarn.nodemanager.env-whitelist 中添加 PATH。
当您使用 Amazon Glue 数据目录作为 Hive 的元存储时，不支持 Live Long and Process (LLAP) 功能。
将 Amazon EMR 6.0.0 与 Spark 和 Docker 集成使用时，您需要使用同一实例类型和相同数量的 EBS 卷配置集群中的实例，以避免在使用 Docker 运行时提交 Spark 任务时出现故障。
在 Amazon EMR 6.0.0 中，Amazon S3 存储模式下的 HBase 受到. 问题的影响。HBASE-24286使用现有 S3 数据创建集群时，无法初始化 HBase 主服务器。
具有多个主节点的集群和 Kerberos 身份验证中的已知问题

如果在 Amazon EMR 版本 5.20.0 及更高版本中运行具有多个主节点的集群和 Kerberos 身份验证，则在集群运行一段时间后，您可能在执行集群操作（如缩减或步骤提交）时遇到问题。具体时间段取决于您定义的 Kerberos 票证有效期。缩减问题会影响您提交的自动缩减和显式缩减请求。其它集群操作也可能会受到影响。

解决办法：
- 以 hadoop 用户身份通过 SSH 连接到具有多个主节点的 EMR 集群的 lead 主节点。
- 运行以下命令，为 hadoop 用户续订 Kerberos 票证。
```
kinit -kt <keytab_file> <principal>
```
  通常情况下，keytab 文件位于 /etc/hadoop.keytab，而 principal 为 hadoop/<hostname>@<REALM> 格式。
注意
此解决方法将在 Kerberos 票证有效期内生效。默认情况下，此持续时间为 10 个小时，但可以通过 Kerberos 设置进行配置。Kerberos 票证过期后，您必须重新运行上述命令。

6.0.0 组件版本

下面列出了 Amazon EMR 随此发行版一起安装的组件。一些组件作为大数据应用程序包的一部分安装。其它组件是 Amazon EMR 独有的，并且已为系统流程和功能安装这些组件。这些通常以emr或开头aws。 Big-data 最新 Amazon EMR 版本中的应用程序包通常是社区中的最新版本。我们会尽快在 Amazon EMR 中提供社区发行版。

Amazon EMR 中的某些组件与社区版本不同。这些组件具有以下形式的 CommunityVersion-amzn-EmrVersion 的发行版标注。EmrVersion 从 0 开始。例如，假设已对名为 myapp-component 的版本 2.2 的开源社区组件进行三次修改，以包含在不同的 Amazon EMR 发行版中，则其发行版将为 2.2-amzn-2。

组件	版本	说明
aws-sagemaker-spark-sdk	1.2.6	亚马逊 SageMaker Spark SDK
emr-ddb	4.14.0	适用于 Hadoop 生态系统应用程序的 Amazon DynamoDB 连接器。
emr-goodies	3.0.0	适用于 Hadoop 生态系统的方便易用的库。
emr-kinesis	3.5.0	适用于 Hadoop 生态系统应用程序的 Amazon Kinesis 连接器。
emr-s3-dist-cp	emrfs	针对 Amazon S3 优化的分布式复制应用程序。
emr-s3-select	1.5.0	EMR S3 Select 连接器
emrfs	2.39.0	适用于 Hadoop 生态系统应用程序的 Amazon S3 连接器。
ganglia-monitor	3.7.2	适用于 Hadoop 生态系统应用程序的嵌入式 Ganglia 代理以及 Ganglia 监控代理。
ganglia-metadata-collector	3.7.2	用于从 Ganglia 监控代理中聚合指标的 Ganglia 元数据收集器。
ganglia-web	3.7.1	用于查看由 Ganglia 元数据收集器收集的指标的 Web 应用程序。
hadoop-client	3.2.1-amzn-0	Hadoop 命令行客户端，如“hdfs”、“hadoop”或“yarn”。
hadoop-hdfs-datanode	3.2.1-amzn-0	用于存储数据块的 HDFS 节点级服务。
hadoop-hdfs-library	3.2.1-amzn-0	HDFS 命令行客户端和库
hadoop-hdfs-namenode	3.2.1-amzn-0	用于跟踪文件名和数据块位置的 HDFS 服务。
hadoop-hdfs-journalnode	3.2.1-amzn-0	用于管理 HA 集群上的 Hadoop 文件系统日志的 HDFS 服务。
hadoop-httpfs-server	3.2.1-amzn-0	用于 HDFS 操作的 HTTP 终端节点。
hadoop-kms-server	3.2.1-amzn-0	基于 Hadoop 的 API 的加密密钥管理服务器。 KeyProvider
hadoop-mapred	3.2.1-amzn-0	MapReduce 用于运行 MapReduce 应用程序的执行引擎库。
hadoop-yarn-nodemanager	3.2.1-amzn-0	用于管理单个节点上的容器的 YARN 服务。
hadoop-yarn-resourcemanager	3.2.1-amzn-0	用于分配和管理集群资源与分布式应用程序的 YARN 服务。
hadoop-yarn-timeline-server	3.2.1-amzn-0	用于检索 YARN 应用程序的当前信息和历史信息的服务。
hbase-hmaster	2.2.3	适用于负责协调区域和执行管理命令的 HBase 集群的服务。
hbase-region-server	2.2.3	用于服务于一个或多个 HBase 区域的服务。
hbase-client	2.2.3	HBase 命令行客户端。
hbase-rest-server	2.2.3	用于向 HBase 提供 RESTful HTTP 终端节点的服务。
hbase-thrift-server	2.2.3	用于向 HBase 提供 Thrift 终端节点的服务。
hcatalog-client	3.1.2-amzn-0	用于操作 hcatalog-server 的“hcat”命令行客户端。
hcatalog-server	3.1.2-amzn-0	用于为分布式应用程序提供 HCatalog、表和存储管理层的服务。
hcatalog-webhcat-server	3.1.2-amzn-0	用于向 HCatalog 提供 REST 接口的 HTTP 终端节点。
hive-client	3.1.2-amzn-0	Hive 命令行客户端。
hive-hbase	3.1.2-amzn-0	Hive-hbase 客户。
hive-metastore-server	3.1.2-amzn-0	用于访问 Hive 元存储 (一个用于存储 Hadoop 操作中的 SQL 的元数据的语义存储库) 的服务。
hive-server2	3.1.2-amzn-0	用于将 Hive 查询作为 Web 请求接受的服务。
hudi	0.5.0-incubating-amzn-1	增量处理框架，以支持低延迟和高效率的数据管道。
hudi-presto	0.5.0-incubating-amzn-1	用于运行 Presto 以及 Hudl 的捆绑库。
hue-server	4.4.0	用于使用 Hadoop 生态系统应用程序分析数据的 Web 应用程序
jupyterhub	1.0.0	Multi-user 适用于 Jupyter 笔记本的服务器
livy-server	0.6.0-incubating	用于与 Apache Spark 交互的 REST 接口
nginx	1.12.1	nginx [引擎 x] 是 HTTP 和反向代理服务器
mxnet	1.5.1	用于深度学习的灵活的、可扩展且高效的库。
mariadb-server	5.5.64+	MariaDB 数据库服务器。
nvidia-cuda	9.2.88	Nvidia 驱动程序和 Cuda 工具包
oozie-client	5.1.0	Oozie 命令行客户端。
oozie-server	5.1.0	用于接受 Oozie 工作流请求的服务。
opencv	3.4.0	开源计算机视觉库。
phoenix-library	5.0.0-HBase-2.0	服务器和客户端的 phoenix 库
phoenix-query-server	5.0.0-HBase-2.0	向 Avatica API 提供 JDBC 访问权限以及协议缓冲区和 JSON 格式访问权限的轻量级服务器
presto-coordinator	0.230	用于在 presto-worker 之中接受查询并管理查询的服务。
presto-worker	0.230	用于执行查询的各个部分的服务。
presto-client	0.230	Presto 命令行客户端，安装在 HA 集群的备用主服务器（未启动 Presto 服务器）上。
r	3.4.3	用于统计计算的 R 项目
spark-client	2.4.4	Spark 命令行客户端。
spark-history-server	2.4.4	用于查看完整的 Spark 应用程序的生命周期的已记录事件的 Web UI。
spark-on-yarn	2.4.4	In-memory YARN 的执行引擎。
spark-yarn-slave	2.4.4	YARN 从属项所需的 Apache Spark 库。
tensorflow	1.14.0	TensorFlow 用于高性能数值计算的开源软件库。
tez-on-yarn	0.9.2	tez YARN 应用程序和库。
webserver	2.4.41+	Apache HTTP 服务器。
zeppelin-server	0.9.0-SNAPSHOT	Web-based 支持交互式数据分析的笔记本。
zookeeper-server	3.4.14	用于维护配置信息、命名、提供分布式同步以及提供组服务的集中式服务。
zookeeper-client	3.4.14	ZooKeeper 命令行客户端。

6.0.0 配置分类

配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件（例如 hive-site.xml）相对应。有关更多信息，请参阅配置应用程序。

emr-6.0.0 分类
分类	说明
capacity-scheduler	更改 Hadoop 的 capacity-scheduler.xml 文件中的值。
container-executor	更改 Hadoop YARN 的 container-executor.cfg 文件中的值。
container-log4j	更改 Hadoop YARN 的 container-log4j.properties 文件中的值。
core-site	更改 Hadoop 的 core-site.xml 文件中的值。
emrfs-site	更改 EMRFS 设置。
hadoop-env	更改适用于所有 Hadoop 组件的 Hadoop 环境中的值。
hadoop-log4j	更改 Hadoop 的 log4j.properties 文件中的值。
hadoop-ssl-server	更改 hadoop ssl 服务器配置
hadoop-ssl-client	更改 hadoop ssl 客户端配置
hbase	Apache HBase 的亚马逊 EMR-curated 设置。
hbase-env	更改 HBase 环境中的值。
hbase-log4j	更改 HBase 的 hbase-log4j.properties 文件中的值。
hbase-metrics	更改 HBase 的 hadoop-metrics2-hbase.properties 文件中的值。
hbase-policy	更改 HBase 的 hbase-policy.xml 文件中的值。
hbase-site	更改 HBase 的 hbase-site.xml 文件中的值。
hdfs-encryption-zones	配置 HDFS 加密区域。
hdfs-env	更改 HDFS 环境中的值。
hdfs-site	更改 HDFS 的 hdfs-site.xml 中的值。
hcatalog-env	更改 HCatalog 的环境中的值。
hcatalog-server-jndi	更改 HCatalog 的 jndi.properties 中的值。
hcatalog-server-proto-hive-site	更改 HCatalog 的 proto-hive-site.xml 中的值。
hcatalog-webhcat-env	更改 HCatalog WebHCat 的环境中的值。
hcatalog-webhcat-log4j2	更改 HCatalog WebHCat 的 log4j2.properties 中的值。
hcatalog-webhcat-site	更改 HCatalog WebHCat 的 webhcat-site.xml 文件中的值。
hive	Apache Hive 的亚马逊 EMR-curated 设置。
hive-beeline-log4j2	更改 Hive 的 beeline-log4j2.properties 文件中的值。
hive-parquet-logging	更改 Hive parquet-logging.properties 文件中的值。
hive-env	更改 Hive 环境中的值。
hive-exec-log4j2	更改 Hive 的 hive-exec-log4j2.properties 文件中的值。
hive-llap-daemon-log4j2	更改 Hive 的 llap-daemon-log4j2.properties 文件中的值。
hive-log4j2	更改 Hive 的 hive-log4j2.properties 文件中的值。
hive-site	更改 Hive 的 hive-site.xml 文件中的值
hiveserver2-site	更改 Hive Server2 的 hiveserver2-site.xml 文件中的值
hue-ini	更改 Hue 的 ini 文件中的值
httpfs-env	更改 HTTPFS 环境中的值。
httpfs-site	更改 Hadoop 的 httpfs-site.xml 文件中的值。
hadoop-kms-acls	更改 Hadoop 的 kms-acls.xml 文件中的值。
hadoop-kms-env	更改 Hadoop KMS 环境中的值。
hadoop-kms-log4j	更改 Hadoop 的 kms-log4j.properties 文件中的值。
hadoop-kms-site	更改 Hadoop 的 kms-site.xml 文件中的值。
jupyter-notebook-conf	更改 Jupyter Notebook 的 jupyter_notebook_config.py 文件中的值。
jupyter-hub-conf	更改 jupyterhub_config.py 文件 JupyterHubs中的值。
jupyter-s3-conf	配置 Jupyter Notebook S3 持久性。
jupyter-sparkmagic-conf	更改 Sparkmagic 的 config.json 文件中的值。
livy-conf	更改 Livy 的 livy.conf 文件中的值。
livy-env	更改 Livy 环境中的值。
livy-log4j	更改 Livy log4j.properties 设置。
mapred-env	更改 MapReduce 应用程序环境中的值。
mapred-site	更改 MapReduce 应用程序的 mapred-site.xml 文件中的值。
oozie-env	更改 Oozie 的环境中的值。
oozie-log4j	更改 Oozie 的 oozie-log4j.properties 文件中的值。
oozie-site	更改 Oozie 的 oozie-site.xml 文件中的值。
phoenix-hbase-metrics	更改 Phoenix 的 hadoop-metrics2-hbase.properties 文件中的值。
phoenix-hbase-site	更改 Phoenix 的 hbase-site.xml 文件中的值。
phoenix-log4j	更改 Phoenix 的 log4j.properties 文件中的值。
phoenix-metrics	更改 Phoenix 的 hadoop-metrics2-phoenix.properties 文件中的值。
presto-log	更改 Presto 的 log.properties 文件中的值。
presto-config	更改 Presto 的 config.properties 文件中的值。
presto-password-authenticator	更改 Presto 的 password-authenticator.properties 文件中的值。
presto-env	更改 Presto 的 presto-env.sh 文件中的值。
presto-node	更改 Presto 的 node.properties 文件中的值。
presto-connector-blackhole	更改 Presto 的 blackhole.properties 文件中的值。
presto-connector-cassandra	更改 Presto 的 cassandra.properties 文件中的值。
presto-connector-hive	更改 Presto 的 hive.properties 文件中的值。
presto-connector-jmx	更改 Presto 的 jmx.properties 文件中的值。
presto-connector-kafka	更改 Presto 的 kafka.properties 文件中的值。
presto-connector-localfile	更改 Presto 的 localfile.properties 文件中的值。
presto-connector-memory	更改 Presto 的 memory.properties 文件中的值。
presto-connector-mongodb	更改 Presto 的 mongodb.properties 文件中的值。
presto-connector-mysql	更改 Presto 的 mysql.properties 文件中的值。
presto-connector-postgresql	更改 Presto 的 postgresql.properties 文件中的值。
presto-connector-raptor	更改 Presto 的 raptor.properties 文件中的值。
presto-connector-redis	更改 Presto 的 redis.properties 文件中的值。
presto-connector-redshift	更改 Presto 的 redshift.properties 文件中的值。
presto-connector-tpch	更改 Presto 的 tpch.properties 文件中的值。
presto-connector-tpcds	更改 Presto 的 tpcds.properties 文件中的值。
ranger-kms-dbks-site	更改 Ranger KMS 的 dbks-site.xml 文件中的值。
ranger-kms-site	更改 Ranger KMS 的 ranger-kms-site.xml 文件中的值。
ranger-kms-env	更改 Ranger KMS 环境中的值。
ranger-kms-log4j	更改 Ranger KMS 的 kms-log4j.properties 文件中的值。
ranger-kms-db-ca	更改 S3 上用于与 Ranger KMS 进行 MySQL SSL 连接的 CA 文件的值。
recordserver-env	在 EMR RecordServer 环境中更改值。
recordserver-conf	更改 EMR 的服务器.proper RecordServer ties 文件中的值。
recordserver-log4j	更改 EMR 的 log4j.propertie RecordServer s 文件中的值。
spark	Apache Spark 的亚马逊 EMR-curated 设置。
spark-defaults	更改 Spark 的 spark-defaults.conf 文件中的值。
spark-env	更改 Spark 环境中的值。
spark-hive-site	更改 Spark 的 hive-site.xml 文件中的值
spark-log4j	更改 Spark 的 log4j.properties 文件中的值。
spark-metrics	更改 Spark 的 metrics.properties 文件中的值。
tez-site	更改 Tez 的 tez-site.xml 文件中的值。
yarn-env	更改 YARN 环境中的值。
yarn-site	更改 YARN 的 yarn-site.xml 文件中的值。
zeppelin-env	更改 Zeppelin 环境中的值。
zookeeper-config	更改 ZooKeeper的 zoo.cfg 文件中的值。
zookeeper-log4j	更改 ZooKeeper的 log4j.properties 文件中的值。

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

emr-6.0.1

Amazon EMR 5.x 发行版