本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 使用数据库创建数据集
<a name="create-a-database-data-set"></a>

以下过程演示了如何连接到数据库数据来源和创建数据集。要使用您的 Amazon Quick 账户自动发现 Amazon 的数据源创建数据集，请使用[使用自动发现的 Amazon Redshift 集群或 Amazon RDS 实例创建数据集](#create-a-data-set-autodiscovered)。要使用任何其他数据库数据来源创建数据集，请使用 [使用非自动发现的数据库创建数据集](#create-a-data-set-database)。

## 使用自动发现的 Amazon Redshift 集群或 Amazon RDS 实例创建数据集
<a name="create-a-data-set-autodiscovered"></a>

使用以下过程创建指向自动发现的 Amazon 数据来源的连接。

**创建与自动发现 Amazon 的数据源的连接**

1. 选中 [数据来源限额](data-source-limits.md) 以确保您的目标表或查询不超出数据来源限制。

1. 确认您计划使用的数据库凭证具有[所需的权限](required-permissions.md)中所述的相应权限。

1. 按照中的说明，确保您已将集群或实例配置为 Amazon Quick 访问权限[网络和数据库配置要求](configure-access.md)。

1. 在 Amazon 快速入门页面上，选择**数据**。

1. 选择 “**创建**”，然后选择 “**新建数据集**”。

1. 根据要连接的 Amazon 服务，选择 **RDS 或 R** **edshift 自动发现**图标。

1. 输入数据源的连接信息，如下所示：
   + 对于**数据来源名称**，输入数据来源的名称。
   + 对于 **Instance ID (实例 ID)**，选择要连接到的实例或集群的名称。
   + **Database name** 会显示 **Instance ID** 集群或实例的默认数据库。要在该集群或实例上使用不同的数据库，请输入其名称。
   + 对于 **UserName**，请输入有权执行以下操作的用户帐户的用户名：
     + 访问目标数据库。
     + 在该数据库中读取要使用的任何表（对其执行 `SELECT` 语句）。
   + 对于**密码**，输入您输入的账户的密码。

1. 选择 **Validate connection** 验证您的连接信息是否正确。

1. 如果连接验证成功，请选择 **Create data source**。如果未成功，则更正连接信息，然后重新验证。
**注意**  
Amazon Quick 使用安全套接字层 (SSL) 自动保护与亚马逊 RDS 实例和 Amazon Redshift 集群的连接。您无需执行任何操作来启用这一功能。

1. 选择下列选项之一：
   + **自定义 SQL**

     在下一个屏幕上，您可以选择使用 **Use custom SQL（使用自定义 SQL）**选项写入查询。这样做将打开一个名为 **Enter custom SQL query (输入自定义 SQL 查询)** 的屏幕，您可以在其中输入查询的名称，然后输入 SQL。为获得最佳结构，请在 SQL 编辑器中构成查询，然后将其粘贴到此窗口中。在命名和输入查询后，您可以选择 **Edit/Preview data（编辑/预览数据）**或 **Confirm query（确认查询）**。立即选择 **Edit/Preview data（编辑/预览数据）**以转到数据准备。选择 **Confirm query（确认查询）**以验证 SQL 并确保没有错误。
   + **选择表**

     要连接到特定表，对于**架构：包含表组**，请选择**选择**，然后选择一个架构。有时数据库只有一个架构，此情况下会自动选择该架构，不显示架构选择选项。

     要在创建分析前准备数据，请选择 **Edit/Preview data** 打开数据准备。如果要联接到更多表，请使用此选项。

     否则，在选择表后，请选择 **Select（选择）**。

1. 请选择以下选项之一：
   + 在创建分析之前准备数据。为此，选择 **Edit/Preview data (编辑/预览数据)** 以打开选定表的数据准备屏幕。有关数据准备的更多信息，请参阅[准备数据集示例](preparing-data-sets.md)。
   + 按原样使用表数据创建一个数据集和分析，并将数据集数据导入到 SPICE 以提高性能（建议）。为此，请检查表大小和 SPICE 指示器以确定您是否具有足够的容量。

     如果有足够的 SPICE 容量，请选择**导入到 SPICE 以加快分析**，然后选择**可视化**创建分析。
**注意**  
如果您希望使用 SPICE 但没有足够的空间，请选择**编辑/预览数据**。在数据准备过程中，您可以从数据集中删除字段以缩减其大小。您也可以应用筛选条件或编写 SQL 查询以减少返回的行或列数。有关数据准备的更多信息，请参阅[准备数据集示例](preparing-data-sets.md)。
   + 要按原样使用表数据创建一个数据集和分析，并直接从数据库中查询数据，请选择**直接查询数据**选项。然后，选择 **Visualize (可视化)** 以创建分析。

## 使用非自动发现的数据库创建数据集
<a name="create-a-data-set-database"></a>

使用以下过程创建指向自动发现的 Amazon Redshift 集群或 Amazon RDS 实例以外的任何数据库连接。此类数据库包括位于不同账户 Amazon Web Services 区域 或与不同账户关联的 Amazon Redshift 集群和 Amazon RDS 实例。 Amazon 它们还包括位于本地、Amazon EC2 或某种其他可访问的环境中的 MariaDB、Microsoft SQL Server、MySQL、Oracle 和 PostgreSQL 实例。

**创建与不是自动发现的 Amazon Redshift 集群或 RDS 实例的数据库连接**

1. 选中 [数据来源限额](data-source-limits.md) 以确保您的目标表或查询不超出数据来源限制。

1. 确认您计划使用的数据库凭证具有[所需的权限](required-permissions.md)中所述的相应权限。

1. 按照中的说明，确保您已将集群或实例配置为 Amazon Quick 访问权限[网络和数据库配置要求](configure-access.md)。

1. 在 Amazon 快速入门页面上，选择**管理数据**。

1. 选择 “**创建**”，然后选择 “**新建数据组”**。

1. 如果您想**连接到其他账户中的 Amazon Redshift 集群或 Amazon Web Services 区域 与其他账户关联的 Amazon Redshift 集群，请选择 Redshift 手动**连接图标。 Amazon 或者，选择相应的数据库管理系统图标以连接到 Amazon Aurora、MariaDB、Microsoft SQL Server、MySQL Oracle 或 PostgreSQL 实例。

1. 输入数据源的连接信息，如下所示：
   + 对于**数据来源名称**，输入数据来源的名称。
   + 对于 **Database server (数据库服务器)**，输入以下值之一：
     + 对于 Amazon Redshift 集群或 Amazon RDS 实例，输入该集群或实例的端点（不带端口号）。例如，如果终端节点值为 `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`，则输入 `clustername.1234abcd.us-west-2.redshift.amazonaws.com`。您可以从 Amazon 控制台集群或实例详细信息页面上的**终端节点**字段中获取终端节点值。
     + 对于 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的 Amazon EC2 实例，输入公有 DNS 地址。在 Amazon EC2 控制台中，您可以在实例详细信息窗格中的**公有 DNS** 字段中获取公有 DNS 值。
     + 对于 MariaDB、Microsoft SQL Server、MySQL、Oracle 或 PostgreSQL 的非 Amazon EC2 实例，输入数据库服务器的主机名或公有 IP 地址。如果您使用安全套接字层 (SSL) 来进行安全连接 (推荐)，则可能需要提供主机名以匹配 SSL 证书所需的信息。有关接受的证书的列表，请参阅[Amazon 快速 SSL 和 CA 证书](configure-access.md#ca-certificates)。
   + 对于 **Port (端口)**，输入集群或实例在连接上使用的端口。
   + 对于 **Database name (数据库名称)**，输入要使用的数据库的名称。
   + 对于 **UserName**，请输入有权执行以下操作的用户帐户的用户名：
     + 访问目标数据库。
     + 在该数据库中读取要使用的任何表（对其执行 `SELECT` 语句）。
   + 对于**密码**，输入与您输入的账户关联的密码。

1. （可选）如果要连接到 Amazon Redshift 集群以外的任何集群或实例，并且*不想*使用安全连接，请确保清除**启用 SSL**。*我们强烈建议您将该选项保持选中状态*，因为不安全的连接可能会遭到篡改。

   有关目标实例如何使用 SSL 保护连接的更多信息，请参阅目标数据库管理系统的文档。Amazon Quick 不接受自签名 SSL 证书为有效证书。有关接受的证书的列表，请参阅[Amazon 快速 SSL 和 CA 证书](configure-access.md#ca-certificates)。

   Amazon Quick 使用 SSL 自动保护与亚马逊 Redshift 集群的连接。您无需执行任何操作来启用这一功能。

   某些数据库，例如 Presto 和 Apache Spark，必须满足其他要求才能连接 Amazon Quick。有关更多信息，请参阅[使用 Presto 创建数据来源](create-a-data-source-presto.md)、或[使用 Apache Spark 创建数据来源](create-a-data-source-spark.md)。

1. (可选) 选择 **Validate connection** 验证您的连接信息是否正确。

1. 如果连接验证成功，请选择 **Create data source**。如果未成功，则更正连接信息，然后重新验证。

1. 选择下列选项之一：
   + **自定义 SQL**

     在下一个屏幕上，您可以选择使用 **Use custom SQL（使用自定义 SQL）**选项写入查询。这样做将打开一个名为 **Enter custom SQL query (输入自定义 SQL 查询)** 的屏幕，您可以在其中输入查询的名称，然后输入 SQL。为获得最佳结构，请在 SQL 编辑器中构成查询，然后将其粘贴到此窗口中。在命名和输入查询后，您可以选择 **Edit/Preview data（编辑/预览数据）**或 **Confirm query（确认查询）**。立即选择 **Edit/Preview data（编辑/预览数据）**以转到数据准备。选择 **Confirm query（确认查询）**以验证 SQL 并确保没有错误。
   + **选择表**

     要连接到特定表，对于**架构：包含表组**，请选择**选择**，然后选择一个架构。有时数据库只有一个架构，此情况下会自动选择该架构，不显示架构选择选项。

     要在创建分析前准备数据，请选择 **Edit/Preview data** 打开数据准备。如果要联接到更多表，请使用此选项。

     否则，在选择表后，请选择 **Select（选择）**。

1. 请选择以下选项之一：
   + 在创建分析之前准备数据。为此，选择 **Edit/Preview data (编辑/预览数据)** 以打开选定表的数据准备屏幕。有关数据准备的更多信息，请参阅[准备数据集示例](preparing-data-sets.md)。
   + 按原样使用表数据创建一个数据集和分析，并将数据集数据导入到 SPICE 以提高性能（建议）。为此，请检查表大小和 SPICE 指示器以确定您是否具有足够的空间。

     如果有足够的 SPICE 容量，请选择**导入到 SPICE 以加快分析**，然后选择**可视化**创建分析。
**注意**  
如果您希望使用 SPICE 但没有足够的空间，请选择**编辑/预览数据**。在数据准备过程中，您可以从数据集中删除字段以缩减其大小。您也可以应用筛选条件或编写 SQL 查询以减少返回的行或列数。有关数据准备的更多信息，请参阅[准备数据集示例](preparing-data-sets.md)。
   + 按原样使用表数据创建一个数据集和分析，并直接从数据库中查询数据。为此，请选择 **Directly query your data (直接查询数据)** 选项。然后，选择 **Visualize (可视化)** 以创建分析。