

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 在中使用数据集 Amazon Glue DataBrew
<a name="datasets.creating"></a>

要在 DataBrew 控制台中查看您的数据集列表，请选择左侧的 D **ATA** SET。在数据集页面中，您可以通过单击每个数据集的名称或从其上下文菜单中选择**操作**、**编辑**来查看每个数据集的详细信息。

要创建新数据集，请选择**数据集**、**连接新数据集**。不同的数据源具有不同的连接参数，您输入这些参数是为了 DataBrew 进行连接。保存连接并选择 “**创建数据集**” 后， DataBrew 将连接到您的数据并开始加载数据。有关更多信息，请参阅 [连接到数据](datasets.connecting-to-data.md)。

数据集页面包含以下元素，可帮助您浏览数据。

**数据集预览**：在此选项卡上，您可以找到数据集的连接信息以及数据集整体结构的概览，如下所示。

![\[Dataset details and preview showing metadata and sample rows from a JSON file stored in S3.\]](http://docs.amazonaws.cn/databrew/latest/dg/images/dataset-preview.png)


**数据剖析概览**：在此选项卡上，您可以找到数据集的统计数据和容量指标的图形数据配置文件，如下所示。

![\[Data profile overview showing dataset summary, data types, missing cells, and correlations.\]](http://docs.amazonaws.cn/databrew/latest/dg/images/data-profile-overview2.png)


**注意**  
要创建数据配置文件，请对您的数据集运行 DataBrew 分析作业。有关如何执行此操作的信息，请参阅 [步骤 5：创建数据配置文件](getting-started.05.md)。

**列统计数据**：在此选项卡上，您可以找到有关数据集中每列的详细统计数据，如下所示。

![\[Data profile overview showing column statistics, data quality, and value distribution for a dataset.\]](http://docs.amazonaws.cn/databrew/latest/dg/images/dataset-column-stats.png)


**数据谱系**-此选项卡以图形方式显示您的数据集是如何创建的，以及如何使用它 DataBrew，如下所示。

![\[Data lineage diagram showing dataset creation and usage flow in DataBrew.\]](http://docs.amazonaws.cn/databrew/latest/dg/images/dataset-lineage.png)


**Topics**
+ [删除数据集](datasets.deleting.md)