本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
数据科学配方步骤
使用这些配方步骤从不同的角度对数据进行制表和汇总,或者执行高级转换。
SCALE
缩放或标准化数值列中的数据范围。
参数
-
sourceColumn
– 现有列的名称。 -
strategy
— 要应用于列值的操作:-
MIN_MAX
— 将值重新缩放到 [0,1] 的范围内 -
SCALE_BETWEEN
— 将值重新缩放到 2 个指定值的范围内。 -
MEAN_NORMALIZATION
— 在 [-1, 1] 的范围内重新调整数据的平均值 (μ) 为 0,标准差 (σ) 为 1 -
Z_SCORE
— 线性缩放数据值,使平均值 (μ) 为 0,标准差 (σ) 为 1。最适合处理异常值。
-
-
targetColumn
— 要包含结果的列的名称。
例 示例
{ "Action": { "Operation": "NORMALIZATION", "Parameters": { "sourceColumn": "all_votes", "strategy": "MIN_MAX", "targetColumn": "all_votes_normalized" } } }