步骤 2:汇总数据 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

步骤 2:汇总数据

在此步骤中,您将构建一个 DataBrew 配方,即一组可以应用于此数据集和其他类似数据集的转换。配方完成后,您可以将其发布以供使用。

在国际象棋游戏中,可以根据玩家与其他玩家的表现来对他们进行评级。(有关更多信息,请参阅https://en.wikipedia.org/wiki/Chess_rating_system)。在本教程中,你只关注两个玩家都是 A 级(即他们的评分均为 1800 或更高)的游戏。

总结数据
  1. 在变换工具栏上,选择筛选按条件大于或等于

  2. 按如下方式设置这些选项:

    • 来源专栏-white_rating

    • 筛选条件-大于或等于 1800

    要查看变换的工作原理,请选择 “预览更改”。然后选择 Apply(应用)。

  3. 重复上一个步骤,但这次将 “来源” 列设置为black_rating。应用更改后,样本数据仅包含双方玩家(黑白)均为 A 级或以上级别的游戏。

  4. 汇总数据以确定双方赢了多少场比赛。为此,请在变换工具栏上选择 “群组”。

  5. 对于群属性,请执行以下操作:

    1. 在第一行中,选择 “winner列名”。将 “聚合” 设置为 “分组依据”

    2. 在第二行中victory_status,选择列名。将 “聚合” 设置为 “分组依据”

    3. 选择 “添加另一列”

    4. 在第三行中,选择 “winner列名”。将聚合设置为计数

    5. 对于 “组类型”,选择 “分组为新表”。预览窗格会显示结果的样子。

    6. 选择完成

  6. 选择 “发布” 以保存您所做的工作,位于食谱窗格的右侧。

  7. 版本描述中,输入我的食谱的第一个版本。然后选择 “发布”。