截然不同的影响 (DI) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

截然不同的影响 (DI)

预测标签量度中正比率的差值可以以比率的形式进行评估。

预测标签量度中正比率的比较可以以比率的形式进行评估,而不是以差值的形式进行评估,就像使用预测标签中正比率的差异 (DPL). 不同影响 (DI) 度量被定义为正面预测 (y' = 1) 的比率a超过正面预测的比例(y' = 1)D. 例如,如果模型预测授予贷款 60% 的中年组(面a)和 50% 其他年龄组(方面D),然后 DI = .5/.6 = 0.8,表示积极偏差和对面产生不利影响D.

预测标签比例比例的公式:

        DI = q'd/qa

其中:

  • q 'a= n'a(1)/na是小平面的预测比例a谁得到了价值 1 的积极结果。在我们的例子中,预计获得贷款的中年层面的比例。n'a(1)表示小平面成员的数量a谁得到一个积极的预测结果和 na是小平面成员的数量a.

  • q 'd= n'd(1)/nd是小平面的预测比例D一个谁获得价值的积极结果 1. 在我们的例子中,一个方面的老年人和年轻人预计会获得贷款。n'd(1)表示小平面成员的数量D谁得到一个积极的预测结果和 nd是小平面成员的数量D.

对于二进制、多重面和连续标注,DI 值在区间 [0, ∞) 范围内。

  • 小于 1 的值表示该小面a预测积极结果的比例高于面D. 这被称为正偏差.

  • 值为 1 表示人口统计等价。

  • 大于 1 的值表示分面D预测积极结果的比例高于面a. 这被称为负偏差.