

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 准备数据集示例


您可以在任何数据集中准备数据以使其更适合分析，例如，更改字段名称或添加计算字段。对于数据库数据集，您还可以通过指定 SQL 查询或联接两个或多个表来确定使用的数据。

可以使用以下主题了解如何准备数据集。

**Topics**
+ [

# 准备基于文件数据的数据集
](prepare-file-data.md)
+ [

# 准备基于 Salesforce 数据的数据集
](prepare-salesforce-data.md)
+ [

# 准备基于数据库数据的数据集
](prepare-database-data.md)

# 准备基于文件数据的数据集


使用以下过程准备基于本地网络或 Amazon S3 上的文本或 Microsoft Excel 文件的数据集。

**准备基于本地网络或 S3 上的文本或 Microsoft Excel 文件的数据集**

1. 通过选择以下选项之一打开用于数据准备的文件数据集：
   + 创建一个新的本地文件数据集，然后选择**编辑/预览数据**。有关从本地文本文件创建新数据集的更多信息，请参阅[使用本地文本文件创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-file.html)。有关使用微软 Excel 文件创建新数据集的更多信息，请参阅[使用微软 Excel 文件创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-excel.html)。
   + 创建新的 Amazon S3 数据集，然后选择**编辑/预览数据**。有关使用新的 Amazon S3 数据源创建新的 Amazon S3 数据集的更多信息，请参阅[使用 Amazon S3 文件创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-s3.html)。有关使用现有 Amazon S3 数据源创建新 Amazon S3 数据集的更多信息，请参阅[使用现有 Amazon S3 数据源创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-existing-s3.html)。
   + 从分析页面或**您的数据集**页面中，打开一个现有的 Amazon S3、文本文件或 Microsoft Excel 数据集以进行编辑。有关打开现有数据集进行数据准备的更多信息，请参阅[编辑数据集](https://docs.amazonaws.cn/quicksight/latest/user/edit-a-data-set.html)。

1. （可选）在数据准备页面上，在应用程序栏上的数据集名称框中输入新名称。

   该名称默认为本地文件的文件名。例如，对于 Amazon S3 文件，该名称默认为 **Group 1**。

1. 检查文件上传设置，必要时进行更正。有关文件上传设置的更多信息，请参阅[选择文件上传设置](https://docs.amazonaws.cn/quicksight/latest/user/choosing-file-upload-settings.html)。
**重要**  
如果要更改上传设置，请在对数据集进行任何其他更改之前进行该更改。新的上传设置会导致 Amazon Quick Sight 重新导入文件。该过程会覆盖您的所有其他更改。

1. 通过执行以下一个或多个操作来准备数据：
   + [选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)
   + [编辑字段名称和描述](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-name.html)
   + [更改字段数据类型](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-data-type.html)
   + [添加计算字段](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-calculated-field-analysis.html)
   + [筛选亚马逊 Quick Sight 中的数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-filter.html)

1. 检查 [SPICE](spice.md) 指示器，以查看您是否有足够的容量来导入数据集。文件数据集自动加载到 SPICE 中。当您选择 **Save & visualize** 或 **Save** 时，系统开始导入操作。

   如果您无权访问足够的 SPICE 容量，可以使用以下选项之一减小数据集大小：
   + 应用筛选条件来限制行数。
   + 选择字段以从数据集中删除。
**注意**  
在删除字段或筛选数据时，SPICE 指示器不会更新以指示节约了多少空间。它继续反映自上次导入以来 SPICE 的使用情况。

1. 选择 **Save** 保存工作，或选择 **Cancel** 取消工作。

   您可能还会看到 **Save & visualize**。根据从中开始的屏幕，可能会显示该选项。如果系统未显示该选项，您可以通过从数据集屏幕启动来创建新的可视化。

## 准备基于 Microsoft Excel 文件的数据集


要准备 Microsoft Excel 数据集，请按照以下过程操作。

**准备 Microsoft Excel 数据集**

1. 通过选择以下选项之一打开用于数据准备的文本文件数据集：
   + 新建一个 Microsoft Excel 数据集，然后选择**编辑/预览数据**。有关创建新 Excel 数据集的更多信息，请参阅[使用 Microsoft Excel 文件创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-excel.html)。
   + 打开现有的 Excel 数据集进行编辑。您可以从分析页面或**您的数据集**页面执行该操作。有关打开现有数据集进行数据准备的更多信息，请参阅[编辑数据集](https://docs.amazonaws.cn/quicksight/latest/user/edit-a-data-set.html)。

1. （可选）在数据准备页面上，在应用程序栏上的数据集名称框中输入名称。如果不重命名数据集，其名称默认为 Excel 文件的名称。

1. 检查文件上传设置，必要时进行更正。有关文件上传设置的更多信息，请参阅[选择文件上传设置](https://docs.amazonaws.cn/quicksight/latest/user/choosing-file-upload-settings.html)。
**重要**  
如果需要更改上传设置，请在对数据集进行任何其他更改之前进行该更改。更改上传设置会导致 Amazon Quick Sight 重新导入文件。该过程会覆盖您到目前为止所做的任何更改。

1. （可选）更改选择的工作表。

1. （可选）更改选择的范围。为此，请从右上角的登录名下方的数据集菜单中打开**上传设置**。

1. 通过执行以下一个或多个操作来准备数据：
   + [选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)
   + [编辑字段名称和描述](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-name.html)
   + [更改字段数据类型](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-data-type.html)
   + [添加计算字段](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-calculated-field-analysis.html)
   + [使用 Quick Sight 筛选数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-filter.html)

1. 检查 [SPICE](spice.md) 指示器，查看您是否有足够的空间来导入数据集。亚马逊 Quick Sight 必须将 Excel 数据集导入SPICE。当您选择 **Save & visualize** 或 **Save** 时，系统将开始此导入操作。

   如果您没有足够的 SPICE 容量，可以使用以下方法之一减小数据集大小：
   + 应用筛选条件来限制行数。
   + 选择字段以从数据集中删除。
   + 缩小要导入的数据范围。
**注意**  
在您加载它们之前，SPICE 指示器不会更新以反映您的更改。其显示自上次导入以来 SPICE 的使用情况。

1. 选择 **Save** 保存工作，或选择 **Cancel** 取消工作。

   您可能还会看到 **Save & visualize**。根据从中开始的屏幕，可能会显示该选项。如果系统未显示该选项，您可以通过从数据集屏幕启动来创建新的可视化。

# 准备基于 Salesforce 数据的数据集


要准备 Salesforce 数据集，请按照以下过程操作。

**准备 Salesforce 数据集**

1. 通过选择以下选项之一打开用于数据准备的 Salesforce 数据集：
   + 新建一个 Salesforce 数据集，然后选择**编辑/预览数据**。有关使用新的 Salesforce 数据源创建新 Salesforce 数据集的更多信息，请参阅[从 Salesforce 创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-salesforce.html)。有关使用现有 Salesforce 数据源创建新 Salesforce 数据集的更多信息，请参阅[使用现有 Salesforce 数据源创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-existing-salesforce.html)。
   + 从分析页面或**您的数据集**页面打开现有的 Salesforce 数据集进行编辑。有关打开现有数据集进行数据准备的更多信息，请参阅[编辑数据集](https://docs.amazonaws.cn/quicksight/latest/user/edit-a-data-set.html)。

1. （可选）如果要更改数据集名称，请在数据准备页面的应用程序栏上的数据集名称框中输入名称。该名称默认为报告或对象名称。

1. (可选) 更改数据元素选择以查看报表或对象。

1. (可选) 更改数据选择以选择不同的报表或对象。

   如果**数据**窗格中显示的列表过长，您可以通过在**搜索表**框中输入搜索词来搜索并找到特定的项目。系统会显示名称中包含该搜索词的任何项目。搜索不区分大小写，不支持通配符。要查看所有项目，请选择搜索框右侧的取消图标 (**X**) 返回。

1. 通过执行以下一个或多个操作来准备数据：
   + [选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)
   + [编辑字段名称和描述](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-name.html)
   + [更改字段数据类型](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-data-type.html)
   + [添加计算字段](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-calculated-field-analysis.html)
   + [使用 Quick Sight 筛选数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-filter.html)

1. 检查 [SPICE](spice.md) 指示器，查看您是否有足够的空间来导入数据集。对于 Salesforce 数据集，需要将数据导入到 SPICE 中。当您选择 **Save & visualize** 或 **Save** 时，导入操作开始。

   如果您没有足够的 SPICE 容量，您可以从数据集中删除字段或应用筛选条件来减小其大小。有关在数据集中添加和移除字段的更多信息，请参阅[选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)。
**注意**  
SPICE 指示器不会更新以反映删除字段或筛选数据可节约的空间。它继续反映从数据源检索的数据集的大小。

1. 选择 **Save** 保存工作，或选择 **Cancel** 取消工作。

   您可能还会看到 **Save & visualize**。根据从中开始的屏幕，可能会显示该选项。如果系统未显示该选项，您可以通过从数据集屏幕启动来创建新的可视化。

# 准备基于数据库数据的数据集


可以使用以下过程基于对数据库的查询准备数据集。该数据集的数据可以来自诸如 Amazon Athena、Amazon RDS 或 Amazon Redshift 之类的 Amazon 数据库数据源，也可以来自外部数据库实例。您可以选择将数据的副本导入 [SPICE](spice.md) 还是直接查询数据。

**准备基于对数据库的查询的数据集**

1. 通过选择以下选项之一打开用于数据准备的数据库数据集：
   + 新建一个数据库数据集，然后选择**编辑/预览数据**。有关使用新数据库数据源创建新数据集的更多信息，请参阅[从数据库创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-database-data-set.html)。有关使用现有数据库数据源创建新数据集的更多信息，请参阅[使用现有数据库数据源创建数据集](https://docs.amazonaws.cn/quicksight/latest/user/create-a-data-set-existing-database.html)。
   + 从分析页面或**您的数据集**页面打开现有数据库的数据集进行编辑。有关打开现有数据集进行数据准备的更多信息，请参阅[编辑数据集](https://docs.amazonaws.cn/quicksight/latest/user/edit-a-data-set.html)。

1. （可选）在数据准备页面上，在应用程序栏上的数据集名称框中输入名称。

   如果在数据准备之前选择一个表，此名称默认为该表名称。否则为 **Untitled data source**。

1. 通过选择以下选项之一来确定您的数据的选择方式：
   + 要使用单个表提供数据，请选择一个表或更改表选择。

     如果在 **Tables** 窗格中显示的表列表很长，您可以在 **Search tables** 中键入搜索词以搜索特定的表。

     系统会显示名称中包含该搜索词的任何表。搜索不区分大小写，不支持通配符。要查看所有表，请选择搜索框右侧的取消图标 (**X**) 返回。
   + 要使用两个或多个联接表提供数据，请选择两个表并使用联接窗格联接它们。如果您选择使用联接表，则必须将数据导入 Quick Sight。有关使用 Amazon Quick Sight 界面连接数据的更多信息，请参阅[联接数据](https://docs.amazonaws.cn/quicksight/latest/user/joining-data.html)。
   + 要使用自定义 SQL 查询在新数据集中提供数据，请在**表**窗格中选择**切换到自定义 SQL** 工具。有关更多信息，请参阅[使用 SQL 自定义数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-SQL-query.html)。

     要更改现有数据集中的 SQL 查询，请在**字段**窗格中选择**编辑 SQL** 打开 SQL 窗格并编辑查询。

1. 通过执行以下一个或多个操作来准备数据：
   + [选择字段](https://docs.amazonaws.cn/quicksight/latest/user/selecting-fields.html)
   + [编辑字段名称和描述](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-name.html)
   + [更改字段数据类型](https://docs.amazonaws.cn/quicksight/latest/user/changing-a-field-data-type.html)
   + [添加计算字段](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-calculated-field-analysis.html)
   + [使用 Quick Sight 筛选数据](https://docs.amazonaws.cn/quicksight/latest/user/adding-a-filter.html)

1. 如果不联接表，请通过选择**查询**或 **SPICE** 单选按钮来选择是直接查询数据库还是将数据导入到 SPICE 中。我们建议使用 SPICE 来提高性能。

   如果要使用 SPICE，请检查 SPICE 指示器，查看您是否有足够的空间导入数据集。当您选择 **Save & visualize** 或 **Save** 时，导入操作开始。

   如果您没有足够的空间，您可以从数据集中删除字段或应用筛选条件来减小其大小。
**注意**  
SPICE 指示器不会更新以反映删除字段或筛选数据可节约的空间。它继续反映从数据源检索的数据集的大小。

1. 选择 **Save** 保存工作，或选择 **Cancel** 取消工作。

   您可能还会看到 **Save & visualize** 选项。根据从中开始的屏幕，可能会显示该选项。如果系统未显示该选项，您可以通过从数据集屏幕启动来创建新的可视化。