使用数据库创建数据集 - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用数据库创建数据集

以下过程演示了如何连接到数据库数据来源和创建数据集。要使用您的 Amazon QuickSight 账户自动发现Amazon的数据源创建数据集,请使用使用自动发现的 Amazon Redshift 集群或 Amazon RDS 实例创建数据集。要使用任何其他数据库数据来源创建数据集,请使用 使用非自动发现的数据库创建数据集

使用自动发现的 Amazon Redshift 集群或 Amazon RDS 实例创建数据集

使用以下过程创建指向自动发现的 Amazon 数据来源的连接。

创建指向自动发现的 Amazon 数据来源的连接
  1. 选中 数据来源限额 以确保您的目标表或查询不超出数据来源限制。

  2. 确认您计划使用的数据库凭证具有所需的权限中所述的相应权限。

  3. 按照中的说明,确保您已将集群或实例配置为 Amazon QuickSight 访问权限网络和数据库配置要求

  4. 在 Amazon QuickSight 起始页上,选择数据集

  5. 数据集页面上,选择新数据集

  6. 创建数据集页面的使用新数据来源部分,根据您要连接的 Amazon 服务选择 RDSRedshift 自动发现图标。

  7. 输入数据源的连接信息,如下所示:

    • 对于 Data source name (数据源名称),输入数据源的名称。

    • 对于 Instance ID (实例 ID),选择要连接到的实例或集群的名称。

    • Database name 会显示 Instance ID 集群或实例的默认数据库。要在该集群或实例上使用不同的数据库,请输入其名称。

    • 对于 UserName,输入有权执行以下操作的用户帐户的用户名:

      • 访问目标数据库。

      • 在该数据库中读取要使用的任何表(对其执行 SELECT 语句)。

    • 对于密码,输入您输入的账户的密码。

  8. 选择 Validate connection 验证您的连接信息是否正确。

  9. 如果连接验证成功,请选择 Create data source。如果未成功,则更正连接信息,然后重新验证。

    注意

    亚马逊使用安全套接字层 (SSL) QuickSight 自动保护与亚马逊 RDS 实例和 Amazon Redshift 集群的连接。您无需执行任何操作来启用这一功能。

  10. 选择以下操作之一:

    • 自定义 SQL

      在下一个屏幕上,您可以选择使用 Use custom SQL(使用自定义 SQL)选项写入查询。这样做将打开一个名为 Enter custom SQL query (输入自定义 SQL 查询) 的屏幕,您可以在其中输入查询的名称,然后输入 SQL。为获得最佳结构,请在 SQL 编辑器中构成查询,然后将其粘贴到此窗口中。在命名和输入查询后,您可以选择 Edit/Preview data(编辑/预览数据)Confirm query(确认查询)。立即选择 Edit/Preview data(编辑/预览数据)以转到数据准备。选择 Confirm query(确认查询)以验证 SQL 并确保没有错误。

    • 选择表

      要连接到特定表,对于架构:包含表组,请选择选择,然后选择一个架构。有时数据库只有一个架构,此情况下会自动选择该架构,不显示架构选择选项。

      要在创建分析前准备数据,请选择 Edit/Preview data 打开数据准备。如果要联接到更多表,请使用此选项。

      否则,在选择表后,请选择 Select(选择)

  11. 请选择以下选项之一:

    • 在创建分析之前准备数据。为此,选择 Edit/Preview data (编辑/预览数据) 以打开选定表的数据准备屏幕。有关数据准备的更多信息,请参阅准备数据集示例

    • 按原样使用表数据创建一个数据集和分析,并将数据集数据导入到 SPICE 以提高性能(建议)。为此,请检查表大小和 SPICE 指示器以确定您是否具有足够的容量。

      如果有足够的 SPICE 容量,请选择导入到 SPICE 以加快分析,然后选择可视化创建分析。

      注意

      如果您希望使用 SPICE 但没有足够的空间,请选择编辑/预览数据。在数据准备过程中,您可以从数据集中删除字段以缩减其大小。您也可以应用筛选条件或编写 SQL 查询以减少返回的行或列数。有关数据准备的更多信息,请参阅准备数据集示例

    • 要按原样使用表数据创建一个数据集和分析,并直接从数据库中查询数据,请选择直接查询数据选项。然后,选择 Visualize (可视化) 以创建分析。

使用非自动发现的数据库创建数据集

使用以下过程创建指向自动发现的 Amazon Redshift 集群或 Amazon RDS 实例以外的任何数据库连接。此类数据库包含位于不同的 Amazon Web Services 区域 区域中或与不同的 Amazon 账户关联的 Amazon Redshift 集群和 Amazon RDS 实例。它们还包括位于本地、Amazon EC2 或某种其他可访问的环境中的 MariaDB、Microsoft SQL Server、MySQL、Oracle 和 PostgreSQL 实例。

创建与不是自动发现的 Amazon Redshift 集群或 RDS 实例的数据库连接
  1. 选中 数据来源限额 以确保您的目标表或查询不超出数据来源限制。

  2. 确认您计划使用的数据库凭证具有所需的权限中所述的相应权限。

  3. 按照中的说明,确保您已将集群或实例配置为 Amazon QuickSight 访问权限网络和数据库配置要求

  4. 在 Amazon QuickSight 起始页上,选择管理数据

  5. 数据集页面上,选择新数据集

  6. 如果需要连接位于其他 Amazon Web Services 区域 或与其他 Amazon 账户关联的 Amazon Redshift 集群,请在创建数据集页面上的使用新数据来源部分中,选择 Redshift 手动连接图标。或者,选择相应的数据库管理系统图标以连接到 Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL Oracle 或 PostgreSQL 实例。

  7. 输入数据源的连接信息,如下所示:

    • 对于 Data source name (数据源名称),输入数据源的名称。

    • 对于 Database server (数据库服务器),输入以下值之一:

      • 对于 Amazon Redshift 集群或 Amazon RDS 实例,输入该集群或实例的端点(不带端口号)。例如,如果终端节点值为 clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234,则输入 clustername.1234abcd.us-west-2.redshift.amazonaws.com。您可以从 Amazon 控制台的集群或实例详细信息页面上的端点字段中获取端点值。

      • 对于 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的 Amazon EC2 实例,输入公有 DNS 地址。在 Amazon EC2 控制台中,您可以在实例详细信息窗格中的公有 DNS 字段中获取公有 DNS 值。

      • 对于 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的非 Amazon EC2 实例,输入数据库服务器的主机名或公有 IP 地址。如果您使用安全套接字层 (SSL) 来进行安全连接 (推荐),则可能需要提供主机名以匹配 SSL 证书所需的信息。有关接受的证书的列表,请参阅QuickSight SSL 和 CA 证书

    • 对于 Port (端口),输入集群或实例在连接上使用的端口。

    • 对于 Database name (数据库名称),输入要使用的数据库的名称。

    • 对于 UserName,输入有权执行以下操作的用户帐户的用户名:

      • 访问目标数据库。

      • 在该数据库中读取要使用的任何表(对其执行 SELECT 语句)。

    • 对于密码,输入与您输入的账户关联的密码。

  8. (可选)如果要连接到 Amazon Redshift 集群以外的任何集群或实例,并且不想使用安全连接,请确保清除启用 SSL我们强烈建议您将该选项保持选中状态,因为不安全的连接可能会遭到篡改。

    有关目标实例如何使用 SSL 保护连接的更多信息,请参阅目标数据库管理系统的文档。Amazon QuickSight 不接受自签名 SSL 证书为有效证书。有关接受的证书的列表,请参阅QuickSight SSL 和 CA 证书

    亚马逊使用 QuickSight SSL 自动保护与亚马逊 Redshift 集群的连接。您无需执行任何操作来启用这一功能。

    某些数据库,例如Presto和Apache Spark,必须满足其他要求 QuickSight 才能让亚马逊进行连接。有关更多信息,请参阅使用 Presto 创建数据来源、或使用 Apache Spark 创建数据来源

  9. (可选) 选择 Validate connection 验证您的连接信息是否正确。

  10. 如果连接验证成功,请选择 Create data source。如果未成功,则更正连接信息,然后重新验证。

  11. 选择以下操作之一:

    • 自定义 SQL

      在下一个屏幕上,您可以选择使用 Use custom SQL(使用自定义 SQL)选项写入查询。这样做将打开一个名为 Enter custom SQL query (输入自定义 SQL 查询) 的屏幕,您可以在其中输入查询的名称,然后输入 SQL。为获得最佳结构,请在 SQL 编辑器中构成查询,然后将其粘贴到此窗口中。在命名和输入查询后,您可以选择 Edit/Preview data(编辑/预览数据)Confirm query(确认查询)。立即选择 Edit/Preview data(编辑/预览数据)以转到数据准备。选择 Confirm query(确认查询)以验证 SQL 并确保没有错误。

    • 选择表

      要连接到特定表,对于架构:包含表组,请选择选择,然后选择一个架构。有时数据库只有一个架构,此情况下会自动选择该架构,不显示架构选择选项。

      要在创建分析前准备数据,请选择 Edit/Preview data 打开数据准备。如果要联接到更多表,请使用此选项。

      否则,在选择表后,请选择 Select(选择)

  12. 请选择以下选项之一:

    • 在创建分析之前准备数据。为此,选择 Edit/Preview data (编辑/预览数据) 以打开选定表的数据准备屏幕。有关数据准备的更多信息,请参阅准备数据集示例

    • 按原样使用表数据创建一个数据集和分析,并将数据集数据导入到 SPICE 以提高性能(建议)。为此,请检查表大小和 SPICE 指示器以确定您是否具有足够的空间。

      如果有足够的 SPICE 容量,请选择导入到 SPICE 以加快分析,然后选择可视化创建分析。

      注意

      如果您希望使用 SPICE 但没有足够的空间,请选择编辑/预览数据。在数据准备过程中,您可以从数据集中删除字段以缩减其大小。您也可以应用筛选条件或编写 SQL 查询以减少返回的行或列数。有关数据准备的更多信息,请参阅准备数据集示例

    • 按原样使用表数据创建一个数据集和分析,并直接从数据库中查询数据。为此,请选择 Directly query your data (直接查询数据) 选项。然后,选择 Visualize (可视化) 以创建分析。