本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
使用 Presto 创建数据来源
Presto(也称为 PrestoDB)是一种开源的分布式 SQL 查询引擎,设计用于针对任何规模的数据进行快速分析查询。它同时支持非关系数据源和关系数据源。支持的非关系数据源包括 Hadoop 分布式文件系统 (HDFS)、Amazon S3、Cassandra、MongoDB 和。 HBase支持的关系数据来源包括 MySQL、PostgreSQL、Amazon Redshift、Microsoft SQL Server 和 Teradata。
有关 Presto 的更多信息,请参阅以下内容:
-
presto 简介,
网站上对 Presto 的描述。 Amazon -
在《亚马逊 EMR 发布指南》中@@ 使用亚马逊弹性 MapReduce (EMR) 创建 prest o 集群。
-
有关 Presto 的一般信息,请参阅 Presto 文档
。
您通过 Presto 查询引擎运行的查询结果可以转换为 Amazon QuickSight 数据集。Presto 在后端数据库中处理分析查询。然后,它会将结果返回给 Amazon QuickSight 客户端。您可以通过 Presto 直接查询数据,也可以将查询结果导入 SPICE.
在使用 Amazon QuickSight 作为 Presto 客户端运行查询之前,请务必配置数据源配置文件。您需要在 Amazon 中 QuickSight 为要访问的每个 Presto 数据源提供数据源配置文件。可以按照以下过程创建到 VPC 的连接。
从亚马逊 QuickSight (控制台)创建与 presto 数据源的新连接
-
在 Amazon QuickSight 起始页上,选择右上角的数据集。然后选择新数据集。
-
选择 Presto 磁贴。
注意
在大多数浏览器中,您可以使用 Ctrl-F 或 Cmd-F 打开搜索框,然后输入
presto
进行查找。 -
添加新数据源的设置:
-
数据来源名称 – 为您的数据来源输入描述性名称。此名称显示在数据集屏幕底部的现有数据来源部分中。
-
连接类型 – 选择连接到 Presto 时需要使用的连接类型。
要通过公有网络进行连接,请选择公有网络。
如果您使用公有网络,则必须使用轻型目录访问协议 (LDAP) 保护您的 Presto 服务器和验证身份。有关将 Presto 配置为使用 LDAP 的信息,请参阅 Presto 文档中的 LDAP authentication
。 要通过虚拟专用连接进行连接,请从 VPC 连接列表中选择相应的 VPC 名称。
如果您的 Presto 服务器允许未经身份验证的访问,则 Amazon 要求您使用私有 VPC 连接安全地连接到该服务器。有关配置新 VPC 的信息,请参阅使用亚马逊连接到 VPC QuickSight。
-
数据库服务器 – 数据库服务器的名称。
-
端口-服务器用来接受来自 Amazon 的传入连接的端口 QuickSight
-
目录 – 要使用的目录的名称。
-
需要身份验证 –(可选)仅当选择 VPC 连接类型时,才会显示此选项。如果您要连接的 Presto 数据来源不需要身份验证,请选择否。否则,请保留默认设置(是)。
-
用户名 – 输入用于连接到 Presto 的用户名。Amazon 将相同的用户名和密码 QuickSight 应用于使用此数据源配置文件的所有连接。如果您想将亚马逊与其他账户 QuickSight 分开监控,请为每个亚马逊 QuickSight 数据源配置文件创建一个 Presto 账户。
您使用的 Presto 账户必须能够访问数据库,并至少能够在一个表上运行
SELECT
语句。 -
密码 – 要与 Presto 用户名一起使用的密码。Amazon QuickSight 会加密您在数据源配置文件中使用的所有凭证。有关更多信息,请参阅 Amazon 中的数据加密 QuickSight。
-
启用 SSL – 默认启用 SSL。
-
-
选择验证连接以测试设置。
-
验证您的设置后,选择创建数据源以完成连接。