Apache Flink - Amazon EMR
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Apache Flink

Apache Flink 是一个流式处理数据流引擎,您可以使用此引擎在高吞吐量数据源上轻松运行实时流处理。Flink支持故障事件的事件时间语义、精确的一次语义、反压控制以及 APIs 针对流式和批处理应用程序的写入进行了优化。

此外,Flink 具有适用于第三方数据源的连接器,例如以下内容:

Amazon EMR 支持 Flink 作为 YARN 应用程序,以便您能管理资源以及集群中的其他应用程序。利用 Flink-on-YARN,您可以提交临时 Flink 作业,也可以创建一个长时间运行的集群,该集群接受多个作业并根据整体 YARN 预留分配资源。

Flink 包含在 Amazon EMR 版本 5.1.0 及更高版本中。

注意

在 Amazon EMR 版本 5.2.1 中增加了对 FlinkKinesisConsumer 类的支持。

下表列出了 Amazon EMR 5.x 系列的最新发布版本附带的 Flink 的版本,以及 Amazon EMR 随 Flink 一起安装的组件。

有关随此发布版本中的 Flink 一起安装的组件的版本,请参阅发布版本 5.31.0 组件版本

Flink emr-5.31.0的版本信息
Amazon EMR 发布版本标签 Flink 版本 随 Flink 安装的组件

另出动-5.31.0

闪烁1.11.0

emerfs,hadoop-client,hadoop-mapred,hhasoop-hdfs-datanode,hadoop-hdfs-library,hadoop-hdfs-namenode,hadoop-httpfs-server,hadoop-kms-server,hadoop-yarn-resourcemanager,hasoop-link,hasoop-link,has