对流数据进行交互式分析 - Managed Service for Apache Flink
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon Managed Service for Apache Flink 之前称为 Amazon Kinesis Data Analytics for Apache Flink。

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

对流数据进行交互式分析

您可以使用由 Apache Zeppelin 提供支持的无服务器笔记本与您的流媒体数据进行交互。您的笔记本可以有多个笔记,每个笔记可以有一个或多个段落供您编写代码。

以下示例 SQL 查询显示了如何从数据源检索数据:

%flink.ssql(type=update) select * from stock;

有关 Flink Streaming SQL 查询的更多示例,请参阅示例和教程以下内容和 Apache Fl ink 文档中的查询

您可以在 Studio 笔记本中使用 Flink SQL 查询来查询流媒体数据。您也可以使用 Python(表 API)和 Scala(表和数据流 API)来编写程序,以交互方式查询您的流数据。您可以查看查询或程序的结果,在几秒钟内对其进行更新,然后重新运行它们以查看更新的结果。

Flink 解释器

您可以使用解释器指定 Managed Service for Apache Flink使用哪种语言来运行您的应用程序。以下解释器与 Managed Service for Apache Flink

名称 描述
%flink FlinkInterpreter Creates ExecutionEnvironment/StreamExecutionEnvironment/BatchTableEnvironment/StreamTableEnvironment and provides a Scala environment
%flink.pyflink PyFlinkInterpreter Provides a python environment
%flink.ipyflink IPyFlinkInterpreter Provides an ipython environment
%flink.ssql FlinkStreamSqlInterpreter Provides a stream sql environment
%flink.bsql FlinkBatchSqlInterpreter Provides a batch sql environment

有关 Flink 解释器的更多信息,请参阅 Apache Zeppelin 的 Flink 解释器。

如果您使用%flink.pyflink%flink.ipyflink作为解释器,则需要使用在ZeppelinContext笔记本中可视化结果。

有关更 PyFlink 具体的示例,请参阅使用适用于 Apache Flink Studio 和 Python 的托管服务以交互方式查询您的数据流

Apache Flink 表环境变量

Apache Zeppelin 提供使用环境变量访问表环境资源的权限。

您可以使用以下变量访问 Scala 表环境资源:

Variable 资源
senvStreamExecutionEnvironment
stenvStreamTableEnvironment 适用于眨眼计划器

您可以使用以下变量访问 Python 表环境资源:

Variable 资源
s_envStreamExecutionEnvironment
st_envStreamTableEnvironment 适用于眨眼计划器

有关使用表环境的更多信息,请参阅 Apache Flink 文档 TableEnvironment中的创建