Trino
Trino 是一个开源查询引擎,专为对各种数据源进行交互式查询而设计。这些可以包括关系数据库、基于文件的数据、HDFS 数据等。带有 Amazon EMR 的 Trino 最常见的用途是对存储在 Amazon S3 中的大型数据集运行复杂的 SQL 查询。它还符合 ANSI SQL 标准,这使得熟悉 SQL 的数据库工程师、数据分析师和数据科学家能够轻松上手。
注意
2020 年 12 月,PrestoSQL 更名为 Trino。Amazon EMR 6.4.0 及更高版本通常指的是 Trino
重要
Trino 的早期版本 PrestoSQL 仍然可以与 Amazon EMR 结合使用。但是,我们强烈建议今后 Trino 与 Amazon EMR 配合使用。另请注意,Trino 和 PrestoSQL 不能在同一集群上同时运行。
下表列出了 Amazon EMR 7.x 最新版本中包含的 Trino 版本,以及 Amazon EMR 与 Trino 一起安装的组件。有关此版本中随 Trino 安装的组件版本,请参阅发行版 7.10.0 组件版本。
| Amazon EMR 发行版标签 | Trino (PrestoSQL) 版本 | 随 Trino (PrestoSQL) 安装的组件 |
|---|---|---|
emr-7.10.0 |
trino-prestosql 470-amzn-0 |
emrfs, emr-goodies, hadoop-client, hadoop-hdfs-datanode, hadoop-hdfs-library, hadoop-hdfs-namenode, hadoop-kms-server, hadoop-yarn-nodemanager, hadoop-yarn-resourcemanager, hadoop-yarn-timeline-server, hive-client, hudi, hudi-trino, hcatalog-server, mariadb-server, trino-coordinator, trino-worker |