入门:Flink 1.6.2 - Amazon Kinesis Data Analytics
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

入门:Flink 1.6.2

本主题包含的入门 (DataStreamAPI)使用 Apache Flink 1.6.2 的教程。

Apache Flink 应用程序的 Kinesis Data Analytics 应用程序的组件

要处理数据,您的 Kinesis Data Analytics 应用程序使用 Java/Apache Maven 或 Scala 应用程序,该应用程序使用 Apache Flink 运行时处理输入和生成输出。

Apache Flink Kinesis Data Analytics 应用程序具有以下组件:

  • 运行时属性:您可以使用运行时属性配置应用程序,而无需重新编译应用程序代码。

  • 源:应用程序通过使用资源. 源连接器从 Kinesis Data Streams、Amazon S3 存储桶等读取数据。有关更多信息,请参阅

  • 运算符:应用程序使用一个或多个来处理数据。运营商. 操作符可以转换、丰富或聚合数据。有关更多信息,请参阅 DataStreamAPI 操作符

  • 接收器:该应用程序使用以下方法为外部源生成数水槽. 接收器连接器将数据写入 Kinesis Data Fire 传输流、Amazon S3 存储桶等。有关更多信息,请参阅 接收器

创建、编译和打包应用程序后,您将代码包上传到 Amazon Simple Storage Service (Amazon S3) 存储桶。然后,您创建 Kinesis Data Analytics 应用程序。您在代码包位置中传入 Kinesis 数据流以作为流数据源,它通常是接收应用程序处理的数据的流或文件位置。

完成练习的先决条件

要完成本指南中的步骤,您必须满足以下条件:

要开始,请转到第 1 步:设置Amazon帐户并创建管理员用户