创建数据来源
| 目标受众:Amazon QuickSight 作者 |
作为 Amazon QuickSight 中的分析作者,您无需了解有关用于连接数据的基础设施的任何内容。您只需设置一次新数据来源。
设置数据来源后,可以从 Amazon QuickSight 控制台中的磁贴访问该数据来源。可以使用该数据来源创建一个或多个数据集。设置数据集后,您还可以从其磁贴访问数据集。通过抽象技术详细信息,Amazon QuickSight 简化了数据连接。
注意
您无需为打算手动上传的文件存储连接设置。有关文件上传的更多信息,请参阅创建数据集。
在开始向 Amazon QuickSight 添加新的数据来源连接配置文件之前,请先收集连接到数据来源所需的信息。在某些情况下,您可能会打算从文件复制和粘贴设置。如果是这样,请确保文件不包含格式字符(列表项目符号或编号)或空格字符(空格、制表符)。还应确保文件不包含非文本“乱码”字符,例如非 ASCII、空值 (ASCII 0) 和控制字符。
以下列表包含收集最常用设置的信息:
-
要连接到的数据来源。
确保您知道需要连接到哪个源以进行报告。此源可能与存储或处理数据或提供数据访问的源不同。
例如,假设您是新加入一家大公司的分析师。您希望分析订购系统中的数据,该系统使用 Oracle。但是,您无法直接查询联机事务处理 (OLTP) 数据。数据子集被提取并存储在 Amazon S3 上的存储桶中,但您也无权访问该子集。您的新同事解释说,他们使用 Amazon Glue 爬网程序读取文件,并且通过 Amazon Lake Formation 访问数据。在进行更广泛的研究后,您了解到需要使用 Amazon Athena 查询作为 Amazon QuickSight 中的数据来源。此处的重点是,选择哪种类型的数据来源并不总是非常明显。
-
新数据来源磁贴的描述性名称。
每个新数据来源连接都需要一个唯一的描述性名称。此名称显示在 Amazon QuickSight 现有数据来源列表中,该列表位于创建一个数据集屏幕的底部。使用一个可轻松地将您的数据来源与其他类似数据来源区分开的名称。新的 Amazon QuickSight 数据来源配置文件同时显示数据库软件徽标以及您分配的自定义名称。
-
要连接到的服务器或实例的名称。
一个唯一名称或其他标识符,标识您的网络上的数据来源的服务器连接器。描述符取决于您要连接的服务器或实例,但通常是以下一个或多个:
-
主机名
-
IP 地址
-
集群 ID
-
实例 ID
-
Connector
-
基于站点的 URL
-
-
要使用的数据集合的名称。
描述符因数据来源而异,但通常是以下之一:
-
数据库
-
数据仓库
-
S3 存储桶
-
目录
-
架构
在某些情况下,您可能需要包含一个清单文件或查询。
-
-
您希望 Amazon QuickSight 使用的用户名。
Amazon QuickSight 每次使用此数据来源配置文件(磁贴)进行连接时,它都会使用连接设置中的用户名。在一些情况下,这可能是您的个人登录信息。但是,如果您打算与其他人共享此信息,请向系统管理员询问有关创建用于 Amazon QuickSight 连接的凭证的信息。
-
要使用的连接的类型。可以选择公有网络或 VPC 连接。如果有多个 VPC 连接可用,请确定要使用哪个连接来访问您的数据来源。
-
一些数据来源需要进行额外设置,例如安全套接字层 (SSL) 或 API 令牌。
将连接设置另存为数据来源配置文件后,可以通过选择数据集磁贴来创建数据集。连接作为数据来源连接配置文件存储在 Amazon QuickSight 中。
要查看现有的连接配置文件,请打开 Amazon QuickSight 起始页,依次选择数据集和新数据集,然后滚动到标题来自现有数据来源。
有关受支持的数据来源连接和示例的列表,请参阅Amazon QuickSight 连接示例。
在 QuickSight 中创建数据来源后,您可以在 QuickSight 中创建包含来自所连接数据来源的数据的数据集。您也可以随时更新数据来源连接信息。