

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 步骤 5：创建数据配置文件
<a name="getting-started.05"></a>

在处理项目时，DataBrew 会显示统计信息，例如样本中的行数和每列中唯一值的分配。这些统计信息以及更多信息表示样本的*配置文件*。

要请求数据配置文件，请创建并运行剖析作业。

**剖析数据集**

1. 在导航窗格上，选择**作业**。

1. 在**剖析作业**选项卡上，选择**创建作业**。

1. 对于**作业名称**，输入 `chess-data-profile`。

1. 对于**作业类型**，选择**创建一个剖析作业**。

1. 在**作业输入**窗格上，执行以下操作：
   + 对于**运行于**，选择**数据集**。
   + 选择**选择数据集**以查看可用数据集列表，然后选择 `chess-games`。

1. 在**作业输出设置**窗格上，执行以下操作：
   + 对于**文件类型**，选择 **JSON**（JavaScript 对象表示法）。
   + 选择 **S3 位置**以查看可用 Amazon S3 存储桶列表，然后选择要使用的存储桶。然后选择**浏览**。在文件夹列表中，选择 `databrew-output`，然后选择**选择**。

1. 在**访问权限**窗格上，选择 `AwsGlueDataBrewDataAccessRole`。这是一个服务相关角色，让 DataBrew 可以代表您访问 Amazon S3 存储桶。

1. 选择**创建并运行作业**。DataBrew 将使用您的设置创建一个作业，然后运行它。

1. 在**作业运行历史记录**窗格上，等待作业状态从 `Running` 更改为 `Succeeded`。

1. 要查看配置文件，请选择**查看配置文件**：  
![\[Icon of a person silhouette with "VIEW PROFILE" text underneath.\]](http://docs.amazonaws.cn/databrew/latest/dg/images/view-profile-button.png)

   此时将显示**数据集**窗口。请花点时间探索以下选项卡：
   + 数据集预览
   + 配置文件概述
   + 列统计数据
   + 数据血统统计信息