在 Amazon Glue 中优化机器学习转换
您可以在 Amazon Glue 中优化机器学习转换来改进数据清理作业的结果,从而实现您的目标。要改进转换,您可以通过生成标记集,添加标签,然后重复这些步骤几次,直到获得所需结果来指导转换。您也可以通过更改一些机器学习参数来进行优化。
有关机器学习转换的更多信息,请参阅使用 Amazon Lake Formation FindMatches 匹配记录。
要了解用于优化机器学习转换的测量值,您应熟悉以下术语:
- 真阳性 (TP)
-
转换正确找到的数据中的匹配项有时称作命中。
- 真阴性 (TN)
-
转换正确拒绝的数据中的不匹配项。
- 假阳性 (FP)
-
转换错误地分类为匹配项的数据中的不匹配项有时称作假警报。
- 假阴性 (FN)
-
转换未找到的数据中的匹配项有时称作未命中。
有关机器学习中使用的术语的更多信息,请参阅 Wikipedia 中的 混淆矩阵
要优化您的机器学习转换,您可以在转换的 Advanced properties (高级属性) 中更改以下测量值。