数据结构配方步骤 - Amazon Glue DataBrew
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据结构配方步骤

使用这些配方步骤可以从不同角度对数据进行表格化和汇总,或执行高级功能。

SCALE

缩放或规范化数字列中的数据范围。

Parameters
  • sourceColumn— 现有列的名称。

  • strategy— 要应用于列值的操作:

    • MIN_MAX— 将值重新调整为 [0,1] 的范围。

    • SCALE_BETWEEN— 将值重新缩放为包含两个指定值的范围。

    • MEAN_NORMALIZATION— 将数据重新缩放为在 [-1, 1] 范围内的均值 (μ) 为 0,标准差 (σ) 为 1。

    • Z_SCORE— 线性缩放数据值,使其平均值 (μ) 为 0,标准差 (σ) 为 1。最适合处理异常值。

  • targetColumn— 要包含结果的列的名称。

例 Example

{ "Action": { "Operation": "NORMALIZATION", "Parameters": { "sourceColumn": "all_votes", "strategy": "MIN_MAX", "targetColumn": "all_votes_normalized" } } }