使用规则集创建配置文件作业 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

使用规则集创建配置文件作业

如上所述创建规则集之后,您将会转到数据质量规则页面,其中显示您账户中的所有规则集。

创建包括规则集在内的配置文件作业
  1. 选择之前创建的规则集的名称以查看其详细信息。

  2. 选择使用规则集创建个人资料作业.

    这些区域有:作业名称已自动填充,但您可以根据需要进行更改。

  3. 适用于Job 运行示例,您可以选择运行整个数据集,也可以选择运行有限的行数。

    如果选择运行有限的样本数量,请注意,对于某些规则,与完整数据集相比,结果可能会有所不同。

  4. 适用于Job 输出设置,选择S3作业输出的位置。选择您有权访问的 Amazon S3 存储桶中的任何文件夹。如果您为此存储桶输入的文件夹名称不存在,则会创建此文件夹。

    成功完成配置文件作业后,此文件夹将包含 JSON 格式的数据和数据质量规则验证报告的配置文件。

  5. UNDER数据质量规则,请注意你的规则集列在下面数据质量规则集名称.

  6. UNDERPermissions (权限),选择或创建要授予的角色 DataBrew 访问从输入的 Amazon S3 位置读取并写入任务输出位置。如果您没有角色准备就绪,请选择创建新的 IAM 角色.

  7. 如中所述修改任何其他可选设置创建和处理Amazon Glue DataBrew个人档案作业,如果需要的话。

  8. 选择创建和运行作业.