

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 准备基于数据库数据的数据集


可以使用以下过程基于对数据库的查询准备数据集。该数据集的数据可以来自诸如 Amazon Athena、Amazon RDS 或 Amazon Redshift 之类的 Amazon 数据库数据源，也可以来自外部数据库实例。您可以选择将数据的副本导入 [SPICE](spice.md) 还是直接查询数据。

**准备基于对数据库的查询的数据集**

1. 通过选择以下选项之一打开用于数据准备的数据库数据集：
   + 新建一个数据库数据集，然后选择**编辑/预览数据**。有关使用新数据库数据源创建新数据集的更多信息，请参阅[从数据库创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-database-data-set.html)。有关使用现有数据库数据源创建新数据集的更多信息，请参阅[使用现有数据库数据源创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-existing-database.html)。
   + 从分析页面或**您的数据集**页面打开现有数据库的数据集进行编辑。有关打开现有数据集进行数据准备的更多信息，请参阅[编辑数据集](https://docs.amazonaws.cn/quicksight/latest/user/edit-a-data-set.html)。

1. （可选）在数据准备页面上，在应用程序栏上的数据集名称框中输入名称。

   如果在数据准备之前选择一个表，此名称默认为该表名称。否则为 **Untitled data source**。

1. 通过选择以下选项之一来确定您的数据的选择方式：
   + 要使用单个表提供数据，请选择一个表或更改表选择。

     如果在 **Tables** 窗格中显示的表列表很长，您可以在 **Search tables** 中键入搜索词以搜索特定的表。

     系统会显示名称中包含该搜索词的任何表。搜索不区分大小写，不支持通配符。要查看所有表，请选择搜索框右侧的取消图标 (**X**) 返回。
   + 要使用两个或多个联接表提供数据，请选择两个表并使用联接窗格联接它们。如果您选择使用联接表，则必须将数据导入 Quick Sight。有关使用 Amazon Quick Sight 界面连接数据的更多信息，请参阅[联接数据](https://docs.amazonaws.cn/quicksight/latest/user/joining-data.html)。
   + 要使用自定义 SQL 查询在新数据集中提供数据，请在**表**窗格中选择**切换到自定义 SQL** 工具。有关更多信息，请参阅[使用 SQL 自定义数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-SQL-query.html)。

     要更改现有数据集中的 SQL 查询，请在**字段**窗格中选择**编辑 SQL** 打开 SQL 窗格并编辑查询。

1. 通过执行以下一个或多个操作来准备数据：
   + [选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)
   + [编辑字段名称和描述](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-name.html)
   + [更改字段数据类型](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-data-type.html)
   + [添加计算字段](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-calculated-field-analysis.html)
   + [使用 Quick Sight 筛选数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-filter.html)

1. 如果不联接表，请通过选择**查询**或 **SPICE** 单选按钮来选择是直接查询数据库还是将数据导入到 SPICE 中。我们建议使用 SPICE 来提高性能。

   如果要使用 SPICE，请检查 SPICE 指示器，查看您是否有足够的空间导入数据集。当您选择 **Save & visualize** 或 **Save** 时，导入操作开始。

   如果您没有足够的空间，您可以从数据集中删除字段或应用筛选条件来减小其大小。
**注意**  
SPICE 指示器不会更新以反映删除字段或筛选数据可节约的空间。它继续反映从数据源检索的数据集的大小。

1. 选择 **Save** 保存工作，或选择 **Cancel** 取消工作。

   您可能还会看到 **Save & visualize** 选项。根据从中开始的屏幕，可能会显示该选项。如果系统未显示该选项，您可以通过从数据集屏幕启动来创建新的可视化。