步骤 2:汇总数据 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 2:汇总数据

在此步骤中,您将构建一个 DataBrew 配方,即一组可以应用于此数据集和其他类似数据集的转换。食谱完成后,您可以将其发布以供使用。

在国际象棋游戏中,可以根据玩家与其他玩家的表现来对他们进行评分。(有关更多信息,请参阅https://en.wikipedia.org/wiki/Chess_rating_system)。在本教程中,您只关注两个玩家都是 A 级的游戏,这意味着他们的评分均为 1800 或以上。

汇总数据
  1. 在转换工具栏上,选择 “筛选”、“按条件”、“大于或等于”。

  2. 按如下方式设置这些选项:

    • 来源专栏-white_rating

    • 过滤条件-大于或等于 1800

    要查看转换的工作原理,请选择 “预览更改”。然后选择 Apply(应用)。

  3. 重复前面的步骤,但这次将 S ource 列设置为black_rating。应用更改后,样本数据仅包含双方玩家(黑白)均为 A 级或以上的游戏。

  4. 汇总数据以确定双方赢了多少场比赛。要执行此操作,请在转换工具栏上选择分组

  5. 对于 Groups(组组属性),执行以下操作:

    1. 在第一行中,选择winner列名。将 “聚合” 设置为 “分组依据”

    2. 在第二行中victory_status,选择列名。将 “聚合” 设置为 “分组依据”

    3. 选择 “添加另一列”

    4. 在第三行中,选择winner列名。将聚合设置为计数

    5. 对于群组类型,选择分组为新表。预览窗格向您显示结果将是什么样子。

    6. 选择 Finish (结束)

  6. 在食谱面板的右侧选择 “发布” 以保存您的作品。

  7. 版本描述中,输入我的食谱的第一个版本。然后选择 “发布”。