对于新项目,我们建议您使用适用于 Apache Flink Studio 的新托管服务,而不是使用适用于 SQL 应用程序的 Kinesis Data Analytics。适用于 Apache Flink Studio 的托管服务将易用性与高级分析功能相结合,使您能够在几分钟内构建复杂的流处理应用程序。
本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
窗口式查询
对应用程序内部流连续执行应用程序代码中的 SQL 查询。应用程序内部流表示通过您的应用程序持续流动的无边界数据。因此,要从该连续更新输入获取结果集,通常可以使用根据时间或行定义的窗口来限制查询。这些查询也称为窗口式 SQL。
对于基于时间的窗口式查询,需要以时间为单位指定窗口大小(例如,一分钟窗口)。这需要在应用程序内部流中有一个单调递增的时间戳列。(新行的时间戳大于或等于前一行。) Amazon Kinesis Data AnalyticsROWTIME
为每个应用程序内数据流提供了一个名为的时间戳列。在指定基于时间的查询时,可以使用该列。对于您的应用程序,可以选择其他某个时间戳选项。有关更多信息,请参阅时间戳和 ROWTIME 列:
对于基于行的窗口式查询,可以使用行数为单位指定窗口大小。
您可以指定查询以滚动窗口、滑动窗口或错开窗口方式处理记录,具体取决于您的应用程序需求。Kinesis Data Analytics 支持以下窗口类型: