Amazon EMR on EKS 7.3.0 发行版 - Amazon EMR
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Amazon EMR on EKS 7.3.0 发行版

本页介绍了 Amazon EMR 的新增和更新的功能,这些功能特定于 Amazon EMR on EKS 部署。有关在亚马逊上运行的亚马逊 EMR EC2 以及亚马逊 EMR 7.3.0 版本的总体详情,请参阅《亚马逊 EMR 发布指南》中的 Amazon EMR 7.3.0

Amazon EMR on EKS 7.3 发行版

以下 Amazon EMR 7.3.0 发行版适用于 Amazon EMR on EKS。选择特定的 emr-7.3.0-XXXX 发行版以查看更多详细信息,例如相关的容器映像标签。

Flink releases

在运行 Flink 应用程序时,以下 Amazon EMR 7.3.0 发行版适用于 Amazon EMR on EKS。

Spark releases

在运行 Spark 应用程序时,以下 Amazon EMR 7.3.0 发行版适用于 Amazon EMR on EKS。

  • emr-7.3.0-latest

  • emr-7.3.0-29240920

  • emr-7.3.0-spark-rapids-latest

  • emr-7.3.0-spark-rapids-29240920

  • emr-7.3.0-java11-latest

  • emr-7.3.0-java11-29240920

  • emr-7.3.0-java8-latest

  • emr-7.3.0-java8-29240920

  • emr-7.3.0-spark-rapids-java8-latest

  • emr-7.3.0-spark-rapids-java8-29240920

  • notebook-spark/emr-7.3.0-latest

  • notebook-spark/emr-7.3.0-29240920

  • notebook-spark/emr-7.3.0-spark-rapids-latest

  • notebook-spark/emr-7.3.0-spark-rapids-29240920

  • notebook-spark/emr-7.3.0-java11-latest

  • notebook-spark/emr-7.3.0-java11-29240920

  • notebook-spark/emr-7.3.0-java8-latest

  • notebook-spark/emr-7.3.0-java8-29240920

  • notebook-spark/emr-7.3.0-spark-rapids-java8-latest

  • notebook-spark/emr-7.3.0-spark-rapids-java8-29240920

  • notebook-python/emr-7.3.0-latest

  • notebook-python/emr-7.3.0-29240920

  • notebook-python/emr-7.3.0-spark-rapids-latest

  • notebook-python/emr-7.3.0-spark-rapids-29240920

  • notebook-python/emr-7.3.0-java11-latest

  • notebook-python/emr-7.3.0-java11-29240920

  • notebook-python/emr-7.3.0-java8-latest

  • notebook-python/emr-7.3.0-java8-29240920

  • notebook-python/emr-7.3.0-spark-rapids-java8-latest

  • notebook-python/emr-7.3.0-spark-rapids-java8-29240920

  • livy/emr-7.3.0-latest

  • livy/emr-7.3.0-29240920

  • livy/emr-7.3.0-java11-latest

  • livy/emr-7.3.0-java11-29240920

  • livy/emr-7.3.0-java8-latest

  • livy/emr-7.3.0-java8-29240920

发行说明

Amazon EMR on EKS 7.3.0 的发布说明

  • 支持的应用程序 适用于 Java 的 Amazon SDK 2.25.70 and 1.12.747, Apache Spark 3.5.1-amzn-1, Apache Hudi 0.15.0-amzn-0, Apache Iceberg 1.5.2-amzn-0, Delta 3.2.0-amzn-0, Apache Spark RAPIDS 24.06.1-amzn-0, Jupyter Enterprise Gateway 2.6.0, Apache Flink 1.18.1-amzn-2, Flink Operator 1.9.0-amzn-0

  • 支持的组件 - aws-sagemaker-spark-sdkemr-ddbemr-goodiesemr-s3-selectemrfshadoop-clienthudihudi-sparkicebergspark-kubernetes

  • 支持的配置分类

    StartJobRun和一起使用 CreateManagedEndpoint APIs:

    分类 描述

    core-site

    更改 core-site.xml Hadoop 文件中的值。

    emrfs-site

    更改 EMRFS 设置。

    spark-metrics

    更改 metrics.properties Spark 文件中的值。

    spark-defaults

    更改 spark-defaults.conf Spark 文件中的值。

    spark-env

    更改 Spark 环境中的值。

    spark-hive-site

    更改 hive-site.xml Spark 文件中的值。

    spark-log4j2

    更改 log4j2.properties Spark 文件中的值。

    emr-job-submitter

    任务提交者 Pod 的配置。

    专门用于以下用途 CreateManagedEndpoint APIs:

    分类 描述

    jeg-config

    更改 Jupyter Enterprise Gateway jupyter_enterprise_gateway_config.py 文件中的值。

    jupyter-kernel-overrides

    更改 Jupyter 内核规范文件中内核映像的值。

    配置分类允许您自定义应用程序。这些通常与应用程序的配置 XML 文件(例如 spark-hive-site.xml)相对应。有关更多信息,请参阅配置应用程序

显著功能

Amazon EMR on EKS 7.3.0 发行版包含以下功能。

  • 应用程序升级:Amazon EMR on EKS 现在包含 Flink Operator 1.9.0。除了其他功能外,Flink Kubernetes 现在还允许为 Autoscaler 设置 CPU 和内存配额。

  • Apache Iceberg 支持 Apache Flink:Apache Iceberg 是一种开源的高性能格式大型分析表。从 Amazon EMR 7.3.0 开始,在 Amazon EMR on EKS 上运行 Apache Flink 时,可使用 Apache Iceberg 表。有关更多信息,请参阅 Amazon EMR on EKS 将 Apache Iceberg 与 Amazon EMR on EKS 结合使用

  • Delta Lake 支持 Apache Flink:Delta Lake 是一种存储层框架,适用于通常基于 Amazon S3 构建的湖屋架构。对于 Amazon EMR 7.3.0 及更高版本,在 Amazon EMR on EKS 上运行 Apache Flink 时,可使用 Delta 表。有关更多信息,请参阅将 Delta Lake 与 Amazon EMR on EKS 结合使用

更改

Amazon EMR on EKS 发行版 7.3.0 包含以下更改。

  • 对于 Amazon EMR on EKS 7.3.0 及更高版本,Apache Flink 现在默认使用 Java 17 运行时。