FillMissingValues 类 - AWS Glue
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

FillMissingValues 类

使用机器学习填充指定 DynamicFrame 列中的 null 值和空字符串。

导入:

from awsglueml.transforms import FillMissingValues

Methods

apply(frame, missing_values_column, output_column =", transformation_ctx ="", info =", stageThreshold = 0, totalThreshold = 0)

在指定列中填充动态帧的缺失值,并在新列中返回估算值的新帧。对于没有缺失值的行,指定列的值将复制到新列。

  • frame – 在其中填充缺失值的 DynamicFrame。必填项。

  • missing_values_column – 包含缺失值(null 值和空字符串)的列。必填项。

  • output_column – 新列的名称,其中包含其值缺失的所有行的估计值。可选;默认值为后缀为 missing_values_column"_filled" 的名称。

  • transformation_ctx – 用于标识状态信息的唯一字符串(可选)。

  • info – 与转换中的错误关联的字符串(可选)。

  • stageThreshold – 在转换出错之前可能在其中发生的最大错误数(可选;默认值为零)。

  • totalThreshold – 在处理出错之前可能全面发生的最大错误数(可选;默认值为零)。

返回一个附加列的新 DynamicFrame,该附加列包含缺失值的行的估计值以及其他行的当前值。