数据科学配方步骤 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据科学配方步骤

使用这些配方步骤从不同的角度对数据进行制表和汇总,或者执行高级转换。

SCALE

缩放或标准化数值列中的数据范围。

参数
  • sourceColumn – 现有列的名称。

  • strategy— 要应用于列值的操作:

    • MIN_MAX— 将值重新缩放到 [0,1] 的范围内

    • SCALE_BETWEEN— 将值重新缩放到 2 个指定值的范围内。

    • MEAN_NORMALIZATION— 在 [-1, 1] 的范围内重新调整数据的平均值 (μ) 为 0,标准差 (σ) 为 1

    • Z_SCORE— 线性缩放数据值,使平均值 (μ) 为 0,标准差 (σ) 为 1。最适合处理异常值。

  • targetColumn— 要包含结果的列的名称。

例 示例

{ "Action": { "Operation": "NORMALIZATION", "Parameters": { "sourceColumn": "all_votes", "strategy": "MIN_MAX", "targetColumn": "all_votes_normalized" } } }