本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
不同的影响力 (DI)
可以以比率的形式评估预测标签指标中的正比例差异。
预测标签指标中正比例的比较可以以比率的形式进行评估,而不是像与预测标签中的正比例差异 (DPPL). 不同影响 (DI) 指标的定义是平面积极预测的比例 (y=1)D超过了平面积极预测的比例(Y=1)一个. 例如,如果模型预测向 60% 的中年群体提供贷款(方面)一个)和 50% 的其他年龄组(方面)D),然后是 DI = .5/.6 = 0.8,这表明对以方面为代表的另一个老年人群有积极的偏见和不利影响D.
预测标签比例的公式:
DI = q'd/q 'a
其中:
-
Q 'an'a(1)/na是平面的预测比例一个他们得到了价值 1 的积极结果。在我们的例子中,预计将获得贷款的中年方面的比例。n'a(1)表示 facet 的成员数一个谁得到了积极的预测结果和 na是 Facet 的成员数量一个.
-
Q 'dn'd(1)/nd是平面的预测比例Da 谁得到了价值 1 的积极结果。在我们的例子中,预计将获得贷款的老年人和年轻人的一个方面。n'd(1)表示 facet 的成员数D谁得到了积极的预测结果和 nd是 Facet 的成员数量D.
对于二进制、多类别平面和连续标签,DI 值在区间 [0, ∞) 范围内。
-
值小于 1 表示该小面一个预计积极结果的比例高于方面D. 这被称为正偏差.
-
值为 1 表示人口均等。
-
值大于 1 表示该小平面D预计积极结果的比例高于方面一个. 这被称为负偏差.