召回差异 (RD) - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

召回差异 (RD)

召回差异 (RD) 指标是偏好分面 a 和不受欢迎的分面 d 之间模型的召回率差异。这些召回中的任何差异都是一种潜在的偏见。召回率是真正的阳性率(TPR),它衡量模型正确预测应获得阳性结果的病例的频率。如果将该方面的所有 y=1 案例都正确预测为 y'=1,则召回对于该分面来说是完美的。当模型最大限度地减少被称为 II 型误差的假阴性时,召回率会更高。例如,模型正确检测到两个不同群体(分面 ad)中应有多少人有资格获得贷款? 如果向分面a贷款的召回率很高而向 d 方面贷款的召回率很低,则差异可以衡量对属于 d 方面的群体的这种偏见。

分面 ad 的召回率差异公式:

        RD = TPa/(TPa + FNa)-TPd/(TPd + FNd) = TPRa-TPRd

其中:

  • TPa 是预测方面 a 的真正正数

  • FNa 是预测分面 a 的假阴性。

  • TPd 是预测方面 d 的真正正数

  • FNd 是预测分面 d 的假阴性。

  • TPRa = TPa/(TPa + FNa) 是刻面 a 的召回率,或其真实阳性率。

  • TPRd TPd/(TPd + FNd) 是刻面 d 的召回率,或其真实阳性率。

例如,考虑以下面 ad 的混淆矩阵。

首选方面 a 的混淆矩阵
a 类预测 实际结果 0 实际结果 1 总计
0 20 5 25
1 10 65 75
总计 30 70 100
不受欢迎的方面 d 的混淆矩阵
d 类预测 实际结果 0 实际结果 1 总计
0 18 7 25
1 5 20 25
总计 23 27 50

召回差异的值为 RD = 65/70-20/27 = 0.93-0.74 = 0.19,这表明对分面 d 存在偏见。

二进制和多类别分类的分面 ad 之间的召回差值范围为 [-1, +1]。此指标对连续标签不可用。

  • 当刻面 a 的召回率高于刻面 d 的召回率时,将获得正值。这表明该模型发现刻面 a 的真正正数要多于分面 d 的真实正数,后者是一种偏差。

  • 接近零的值表示正在比较的刻面的召回次数是相似的。这表明该模型在这两个方面发现的真实阳性数量大致相同,并且没有偏见。

  • 当刻面 d 的召回率高于刻面 a 的召回率时,将获得负值。这表明该模型发现刻面 d 的真实正数要多于分面 a 的真实正数,后者是一种偏差。