创建 Studio 笔记本 - Amazon Kinesis Data Analytics
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建 Studio 笔记本

Studio 笔记本包含使用 SQL、Python 或 Scala 编写的查询或程序,这些查询或程序在流数据上运行并返回分析结果。您可以使用控制台或 CLI 创建应用程序,并提供用于分析来自数据源的数据的查询。

您的应用程序包含下列组件:

  • 数据源,例如 Amazon MSK 集群、Kinesis 数据流或 Amazon S3 存储桶。

  • Amazon Glue 数据库。此数据库包含存储数据源、目标架构和终端节点的表。有关更多信息,请参阅 使用 Amazon Glue

  • 您的应用程序代码。你的代码实现你的分析查询或程序。

  • 应用程序设置和运行时属性。有关应用程序设置和运行时属性的信息,请参阅中的以下主题。Apache Flink 应用程序的开发人员指南

    • 应用程序并行性和扩展:您可以使用应用程序的 “并行度” 设置来控制应用程序可以同时执行的查询数量。如果查询有多个执行路径,例如在以下情况下,您的查询也可以利用增加的并行性:

      • 处理 Kinesis 数据流的多个分片时

      • 当使用KeyBy运算符。

      • 使用多个窗口运算符时

      有关应用扩展的更多信息,请参阅。Apache Flink 的 Kinesis Data Analytics 中的应用程序扩展.

    • 日志记录和监控:有关应用程序记录和监控的信息,请参阅Amazon Kinesis Data Analytics 中的 Apache Flink.

    • 您的应用程序使用检查点和保存点来容错。默认情况下,Studio 笔记本电脑不启用检查点和保存点。

您可以使用Amazon Web Services Management Console或者Amazon CLI.

从控制台创建应用程序时,您可以选择以下选项:

  • 在 Amazon MSK 控制台中,选择您的集群,然后选择实时处理数据.

  • 在 Kinesis Data Streams 控制台中,选择您的数据流,然后在应用程序选项卡选择实时处理数据.

  • 在 Kinesis Data Analytics 控制台中,选择工作室选项卡,然后选择创建 Studio 笔记本.

有关如何使用Amazon Web Services Management Console或者Amazon CLI,请参阅教程:在 Kinesis Data Analytics 中创建 Studio 笔记本.