AWS::Glue::MLTransform FindMatchesParameters - AWS CloudFormation
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

AWS::Glue::MLTransform FindMatchesParameters

用于配置查找匹配项转换的参数。

语法

要在 AWS CloudFormation 模板中声明此实体,请使用以下语法:

JSON

{ "AccuracyCostTradeoff" : Double, "EnforceProvidedLabels" : Boolean, "PrecisionRecallTradeoff" : Double, "PrimaryKeyColumnName" : String }

属性

AccuracyCostTradeoff

调整转换以在准确性与成本之间取得平衡时选择的值。值 0.5 表示系统平衡了准确性和成本问题。值 1.0 表示纯准确性偏差,这通常导致更高的成本,有时甚至非常高。值 0.0 表示纯成本偏差,这会导致不太准确的 FindMatches 转换,有时会导致准确性不可接受。

准确性衡量转换发现真阳性和真阴性的程度。提高准确性需要更多的机器资源和成本。但这也会导致查全率提高。

成本衡量运行转换所消耗的计算资源(从而产生成本)的数量。

必需:否

类型:双精度

Update requires: No interruption

EnforceProvidedLabels

要启用或禁用的值,以强制输出与用户提供的标签相匹配。如果值为 True,则 find matches 转换强制输出与提供的标签相匹配。结果覆盖了正常的合并结果。如果值为 False,则 find matches 转换不能确保遵循提供的所有标签,并且结果依赖于训练后的模型。

请注意,将此值设置为 true 可能会增加合并执行时间。

必需:否

类型:布尔值

Update requires: No interruption

PrecisionRecallTradeoff

调整转换以在查准率与查全率之间取得平衡时选择的值。值 0.5 表示没有偏好;值 1.0 表示纯查准率偏差,值 0.0 表示查全率偏差。由于这是一个权衡,选择接近 1.0 的值意味着非常低的查全率,而选择接近 0.0 的值会导致非常低的查准率。

查准率指标指示模型在预测匹配时正确的频率。

查全率指标表示,对于实际匹配,您的模型预测匹配的频率。

必需:否

类型:双精度

Update requires: No interruption

PrimaryKeyColumnName

唯一标识源表中的行的列名称。用于帮助标识匹配的记录。

必需:是

类型:字符串

Update requires: Replacement