Amazon EMR
Amazon EMR 版本指南
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 Amazon AWS 入门

Apache Flink

Apache Flink 是一个流式处理数据流引擎,您可以使用此引擎在高吞吐量数据源上轻松运行实时流处理。Flink 支持无序事件的事件时间语义、确切一次语义、反向压力控制以及已为写入流和批处理应用程序优化的 API。

此外,Flink 具有适用于第三方数据源的连接器,例如以下内容:

Amazon EMR 支持 Flink 作为 YARN 应用程序,以便您能管理资源以及集群中的其他应用程序。利用 Flink-on-YARN,您可以提交临时 Flink 作业,也可以创建一个长时间运行的集群,该集群接受多个作业并根据整体 YARN 预留分配资源。

Flink 包含在 Amazon EMR 发布版本 5.1.0 及更高版本中。

注意

在 Amazon EMR 发布版本 5.2.1 中增加了对 FlinkKinesisConsumer 类的支持。

下表列出了最新版的 Amazon EMR 附带的 Flink 的版本,以及 Amazon EMR 随 Flink 一起安装的组件。

有关随此版本中的 Flink 一起安装的组件的版本,请参阅发行版 5.13.0 组件版本

emr-5.13.0 的 Flink 版本信息

Amazon EMR 发行版标签 Flink 版本 随 Flink 安装的组件

emr-5.13.0

Flink 1.4.0

emrfs、hadoop-client、hadoop-mapred、hadoop-hdfs-datanode、hadoop-hdfs-library、hadoop-hdfs-namenode、hadoop-httpfs-server、hadoop-kms-server、hadoop-yarn-nodemanager、hadoop-yarn-resourcemanager、hadoop-yarn-timeline-server、flink-client