为 Apache Flink 应用程序创建 Kinesis Data Analytics 应用程序 - Amazon Kinesis Data Analytics
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

为 Apache Flink 应用程序创建 Kinesis Data Analytics 应用程序

本主题包含有关创建适用于 Apache Flink 的 Kinesis Data Analytics 应用程序的信息。

构建 Kinesis Data Analytics 应用程序代码

本节介绍了用于为 Kinesis Data Analytics 应用程序构建应用程序代码的组件。

我们建议您将支持的最新 Apache Flink 版本用于应用程序代码。Kinesis Data Analytics 支持的最新 Apache Flink 版本是1.13.2. 有关升级 Kinesis Data Analytics 应用程序的信息,请参升级应用程序.

您可以使用 Apache Maven 构建应用程序代码。Apache Maven 项目使用 pom.xml 文件以指定它使用的组件的版本。

注意

Kinesis Data Analytics 支持最多 512 MB 大小的 JAR 文件。如果使用的 JAR 文件超过该大小,应用程序将无法启动。

将以下组件版本用于 Kinesis Data Analytics 应用程序:

组件 版本
Java 11(推荐)
Scala 2.12
适用于 Flink 运行时的 Kinesis Data Analytics (aws-kinesisanalytics-runtime) 1.2.0
Kinesis Data Analytics Flink 连接器 (aws-kinesisanalytics-flink) 2.0.0
AmazonKinesis 连接器 (flink-connector-kinesis) 1.13.2
Apache Beam(仅限 Beam 应用程序) 使用 2.33.0、杰克逊版本 2.12.2
注意

在新区域中,我们仅支持服务可用时及以后的最新 Flink 版本。

对于一个例子pom.xml使用 Apache Flink 版本 1.13.2 的 Kinesis Data Analytics 应用程序的文件,请参阅Kinesis Data Analytics 入门应用程序。

有关创建使用的 Kinesis Data Analytics 应用程序的信息Apache Beam,请参阅使用 Apache Beam.

在使用 Kinesis Data Analytics 版本 1.1.0 及更高版本时,您可以在编译应用程序时指定应用程序使用的 Apache Flink 版本。您可以使用 -Dflink.version 参数提供 Apache Flink 版本,如下所示:

mvn package -Dflink.version=1.13.2

有关使用旧版本的 Apache Flink 构建应用程序的信息,请参阅早期版本

创建 Kinesis Data Analytics 应用程序

在构建应用程序代码后,您可以执行以下操作以创建 Kinesis Data Analytics 应用程序:

  • 上传应用程序代码:将应用程序代码上传到 Amazon S3 存储桶。在创建应用程序时,您可以指定应用程序代码的 S3 存储桶名称和对象名称。有关说明如何上传应用程序代码的教程,请参阅入门 (DataStreamAPI)教程中的上传 Apache Flink 流式处理 Java 代码

  • 创建 Kinesis Data Analytics 应用程序:使用以下方法之一以创建 Kinesis Data Analytics 应用程序:

    • 使用创建 Kinesis Data Analytics 应用程序Amazon控制台:您可以使用Amazon控制台。

      在使用控制台创建应用程序时,应用程序的相关资源(例如CloudWatch为您创建了日志流、IAM 角色和 IAM 策略)。

      在使用控制台创建应用程序时,您可以从 Kinesis Analytics - Create application (Kinesis Analytics - 创建应用程序) 页面上的下拉列表中进行选择,以指定应用程序使用的 Apache Flink 版本。

      有关如何使用控制台创建应用程序的教程,请参阅入门 (DataStreamAPI)教程中的创建并运行应用程序(控制台)

    • 使用创建 Kinesis Data Analytics 应用程序AmazonCLI:您可以使用AmazonCLI。

      在使用 CLI 创建应用程序时,您还必须创建应用程序的相关资源(例如CloudWatch手动记录流、IAM 角色和 IAM 策略)。

      在使用 CLI 创建应用程序时,您可以使用 CreateApplication 操作的 RuntimeEnvironment 参数指定应用程序使用的 Apache Flink 版本。

      有关如何使用 CLI 创建应用程序的教程,请参阅入门 (DataStreamAPI)教程中的创建并运行应用程序 (Amazon CLI)

    注意

    您无法更改现有应用程序的 RuntimeEnvironment。如果您需要更改现有应用程序的 RuntimeEnvironment,则必须删除该应用程序并重新创建。

启动 Kinesis Data Analytics 应用程序

在构建应用程序代码、将其上传到 S3 并创建 Kinesis Data Analytics 应用程序后,您可以启动应用程序。启动 Kinesis Data Analytics 应用程序通常需要几分钟时间。

可以使用以下方法之一以启动应用程序:

  • 启动 Kinesis Data Analytics 应用程序Amazon控制台:你可以通过选择运行应用程序运行在应用程序页面上Amazon控制台。

  • 启动 Kinesis Data Analytics 应用程序AmazonAPI:你可以使用StartApplicationaction.

验证 Kinesis Data Analytics 应用程序

您可以通过以下方式验证应用程序是否正常工作:

  • 使用CloudWatch日志:您可以使用CloudWatch日志和CloudWatch记录 Insights 以验证应用程序是否正常工作。有关使用的信息CloudWatch使用 Kinesis Data Analytics 应用程序记录,请参阅日志记录和监控.

  • 使用CloudWatch指标:您可以使用CloudWatch监控应用程序活动的指标,或监控应用程序用于输入或输出的资源(例如 Kinesis Data Firehose 传输流或 Amazon S3 存储桶)中的活动。有关 的更多信息CloudWatch指标,请参阅使用指标在 AmazonCloudWatch用户指南。

  • 监控输出位置:如果应用程序将输出写入到某个位置(例如 Amazon S3 存储桶或数据库),您可以在该位置中监控写入的数据。