入门:Flink 1.8.2 - Managed Service for Apache Flink
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Managed Service for Apache Flink 之前称为 Amazon Kinesis Data Analytics for Apache Flink。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门:Flink 1.8.2

本主题包含一个使用 Apache Flink 1.8.2 的 入门指南 (DataStream API) 教程版本。

Managed Service for Apache Flink 应用程序组件

为了处理数据,您的Managed Service for Apache Flink 应用程序使用 Java/Apache Maven 或 Scala 应用程序,该应用程序使用 Apache Flink 运行时处理输入和生成输出。

Managed Service for Apache Flink 应用程序包含以下组件:

  • 运行时属性:您可以使用运行时属性 配置应用程序,而无需重新编译应用程序代码。

  • 源:应用程序通过 使用数据。源连接器从 Kinesis 数据流、Amazon S3 存储桶等读取数据。有关更多信息,请参阅

  • 运算符:应用程序使用一个或多个运算符 以处理数据。运算符可以转换、丰富或聚合数据。有关更多信息,请参阅 数据流 API 运算符

  • 接收器:应用程序使用接收器 将生成的数据发送到外部源。接收器连接器将数据写入到 Kinesis 数据流、Kinesis Data Firehose 流、Amazon S3 存储桶等。有关更多信息,请参阅 接收器

在创建、编译和打包您的应用程序代码后,您可以将代码包上传到 Amazon Simple Storage Service (Amazon S3) 存储桶中。然后,您创建一个 Managed Service for Apache Flink 应用程序。您在代码包位置中传入一个 Kinesis 数据流以作为流数据源,它通常是接收应用程序处理的数据的流或文件位置。

完成练习的先决条件

要完成本指南中的步骤,您必须满足以下条件:

要开始,请转到步骤 1:设置 Amazon 账户并创建管理员用户