本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
步骤 2:汇总数据
在此步骤中,您将构建一个 DataBrew 配方,即一组可以应用于此数据集和其他类似数据集的转换。配方完成后,您可以将其发布以供使用。
在国际象棋游戏中,可以根据玩家与其他玩家的表现来对他们进行评级。(有关更多信息,请参阅https://en.wikipedia.org/wiki/Chess_rating_system
总结数据
-
在变换工具栏上,选择筛选、按条件、大于或等于。
-
按如下方式设置这些选项:
-
来源专栏-
white_rating
-
筛选条件-大于或等于 1800
要查看变换的工作原理,请选择 “预览更改”。然后选择 Apply(应用)。
-
-
重复上一个步骤,但这次将 “来源” 列设置为
black_rating
。应用更改后,样本数据仅包含双方玩家(黑白)均为 A 级或以上级别的游戏。 -
汇总数据以确定双方赢了多少场比赛。为此,请在变换工具栏上选择 “群组”。
-
对于群组属性,请执行以下操作:
-
在第一行中,选择 “
winner
列名”。将 “聚合” 设置为 “分组依据”。 -
在第二行中
victory_status
,选择列名。将 “聚合” 设置为 “分组依据”。 -
选择 “添加另一列”。
-
在第三行中,选择 “
winner
列名”。将聚合设置为计数。 -
对于 “组类型”,选择 “分组为新表”。预览窗格会显示结果的样子。
-
选择完成。
-
-
选择 “发布” 以保存您所做的工作,位于食谱窗格的右侧。
-
在版本描述中,输入我的食谱的第一个版本。然后选择 “发布”。