本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
召回差异 (RD)
召回差异 (RD) 指标是偏好分面 a 和不受欢迎的分面 d 之间模型的召回率差异。这些召回中的任何差异都是一种潜在的偏见。召回率是真正的阳性率(TPR),它衡量模型正确预测应获得阳性结果的病例的频率。如果将该方面的所有 y=1 案例都正确预测为 y'=1,则召回对于该分面来说是完美的。当模型最大限度地减少被称为 II 型误差的假阴性时,召回率会更高。例如,模型正确检测到两个不同群体(分面 a 和 d)中应有多少人有资格获得贷款? 如果向分面a贷款的召回率很高,而向 d 方面贷款的召回率很低,则差异可以衡量对属于 d 方面的群体的这种偏见。
分面 a 和 d 的召回率差异公式:
RD = TPa/(TPa + FNa)-TPd/(TPd + FNd) = TPRa-TPRd
其中:
-
TPa 是预测方面 a 的真正正数。
-
FNa 是预测分面 a 的假阴性。
-
TPd 是预测方面 d 的真正正数。
-
FNd 是预测分面 d 的假阴性。
-
TPRa = TPa/(TPa + FNa) 是刻面 a 的召回率,或其真实阳性率。
-
TPRd TPd/(TPd + FNd) 是刻面 d 的召回率,或其真实阳性率。
例如,考虑以下面 a 和 d 的混淆矩阵。
首选方面 a 的混淆矩阵 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
a 类预测 | 实际结果 0 | 实际结果 1 | 总计 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 | 20 | 5 | 25 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1 | 10 | 65 | 75 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
总计 | 30 | 70 | 100 |
不受欢迎的方面 d 的混淆矩阵 | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
d 类预测 | 实际结果 0 | 实际结果 1 | 总计 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
0 | 18 | 7 | 25 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
1 | 5 | 20 | 25 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
总计 | 23 | 27 | 50 |
召回差异的值为 RD = 65/70-20/27 = 0.93-0.74 = 0.19,这表明对分面 d 存在偏见。
二进制和多类别分类的分面 a 和 d 之间的召回差值范围为 [-1, +1]。此指标对连续标签不可用。
-
当刻面 a 的召回率高于刻面 d 的召回率时,将获得正值。这表明该模型发现刻面 a 的真正正数要多于分面 d 的真实正数,后者是一种偏差。
-
接近零的值表示正在比较的刻面的召回次数是相似的。这表明该模型在这两个方面发现的真实阳性数量大致相同,并且没有偏见。
-
当刻面 d 的召回率高于刻面 a 的召回率时,将获得负值。这表明该模型发现刻面 d 的真实正数要多于分面 a 的真实正数,后者是一种偏差。