在中使用数据集 Amazon Glue DataBrew - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在中使用数据集 Amazon Glue DataBrew

要在 DataBrew 控制台中查看您的数据集列表,请选择左侧的 D ATA SET。在数据集页面中,您可以通过单击每个数据集的名称或从其快捷菜单中选择 “操作”、“编辑” 来查看每个数据集的详细信息。

要创建新数据集,请选择 DATASE T、Connect 新数据集不同的数据源具有不同的连接参数,您输入这些参数是为了 DataBrew 进行连接。保存连接并选择 “创建数据集” 后, DataBrew 将连接到您的数据并开始加载数据。有关更多信息,请参阅 连接到您的数据

数据集页面包含以下元素,可帮助您浏览数据。

数据集预览-在此选项卡上,您可以找到数据集的连接信息以及数据集整体结构的概述,如下所示。

数据配置文件概述 — 在此选项卡上,您可以找到数据集的统计数据和体积的图形数据配置文件,如下所示。

注意

要创建数据配置文件,请对您的数据集运行 DataBrew 分析作业。有关如何执行此操作的信息,请参阅 步骤 5:创建数据配置文件

列统计信息-在此选项卡上,您可以找到有关数据集中每列的详细统计信息,如下所示。

数据谱系-此选项卡以图形方式显示您的数据集是如何创建的,以及如何使用它 DataBrew,如下所示。