拒绝率差异 (DRR) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

拒绝率差异 (DRR)

拒绝率差异 (DRR) 指标是分面 ad 的真阴性 (TN) 预测结果与观测阴性结果 (TN + FN) 之比的差异。该指标衡量了模型对这两个分面的拒绝率的预测精度差异。精度衡量的是模型从不合格候选人库中识别出的不合格候选人的比例。如果模型对不合格申请人的预测精度在不同分面之间存在差异,这就是偏差,其大小由 DRR 来衡量。

分面 ad 之间拒绝率差异的公式:

        DRR = TNd/(TNd + FNd) - TNa/(TNa + FNa)

前述 DRR 等式的分量如下所示。

  • TNd 是分面 d 的真阴性预测值。

  • FNd 是分面 d 的假阴性预测值。

  • TPa 是分面 a 的真阴性预测值。

  • FNa 是分面 a 的假阴性预测值。

例如,假设该模型拒绝了 100 名中年贷款申请人(分面 a)(预测阴性标签),其中 80 人实际上不合格(观测阴性标签)。还假设该模型拒绝来自其他年龄人群(分面 d)的 50 名申请人申请贷款(预测阴性标签),其中只有 40 人实际上不合格(观测阴性标签)。那么 DRR = 40/50 - 80/100 = 0,表明没有偏差。

二进制、多类别分面和连续标签的 DRR 值范围为 [-1, +1]。

  • 当分面 d 的预测阴性结果(拒绝)与观测阴性结果(不合格申请人)之比大于分面 a 的这一比率时,就会出现正值。这些值表示由于分面 a 中出现相对较多的假阴性,因此可能存在不利于有利分面 a 的偏差。比率的差异越大,表观偏差就越严重。

  • 当分面 ad 的预测阴性结果(拒绝)与观测阴性结果(不合格申请人)之比具有相似的值时,就会出现接近零的值,这表明模型以同样的精度预测阴性结果的观测标签。

  • 当分面 a 的预测阴性结果(拒绝)与观测阴性结果(不合格申请人)之比大于分面 d 的这一比率时,就会出现负值。这些值表示由于分面 d 中出现相对较多的假阳性,因此可能存在不利于不利分面 d 的偏差。比率的差异越负,表观偏差就越严重。