本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
在中使用数据集Amazon Glue DataBrew
要在中查看数据集的列表 DataBrew 控制台,选择数据集在左侧。在数据集页面中,您可以通过单击每个数据集的名称或选择以查看其详细信息操作、编辑从其上下文菜单中。
要创建新数据集,您可以选择数据集、Connect 新数据集. 不同的数据源具有不同的连接参数,您输入这些参数以便 DataBrew 可以连接。当你保存连接并选择创建数据集、 DataBrew 连接到数据并开始加载数据。有关更多信息,请参阅 连接到您的数据。
数据集页面包含以下元素,可帮助您浏览数据。
数据集预览— 在此选项卡上,您可以找到数据集的连接信息以及数据集整体结构的概述,如下所示。

数据概述— 在此选项卡上,您可以找到数据集的统计数据和体积图形数据配置文件,如下所示。

注意
要创建数据配置文件,请运行 DataBrew 数据集上的个人资料作业。有关如何执行此操作的信息,请参阅 步骤 5:创建数据配置文件。
列统计数据— 在此选项卡上,您可以找到有关数据集中每个列的详细统计信息,如下所示。

数据谱系— 此选项卡显示了数据集的创建方式以及如何在 DatabreW 中使用数据集,如下所示。
