拒绝率的差异 (DRR) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

拒绝率的差异 (DRR)

拒绝率 (DRR) 指标的差异是方面的真正负值 (TN) 预测与观察到的负面值 (TN + FN) 的比率的差异一个D. 该指标衡量了预测这两个方面的拒绝情况的模型的精度差异。精确度衡量模型确定的不合格候选人库中不合格候选人的比例。如果预测不合格申请人的模型精度在各个方面之间存在差异,那么这是一种偏差,其规模由 DRR 来衡量。

不同方面之间拒绝率差异的公式一个D

        DRR = TNd/(TNd+ FNd)-TNa/(TNa+ FNa

其中:

  • TNd是预测的真正负面D.

  • FNd是预计的错误的负面D.

  • TPa是预测的真正负面一个.

  • FNa是预计的错误的负面一个.

例如,假设该模型拒绝了 100 名中年申请人(方面)一个)贷款(预计的负面标签),其中 80 个实际上是不合格的(观察到的负面标签)。还假设该模型拒绝了 50 名来自其他年龄人口统计的申请人(方面)D)贷款(预计的负面标签),其中只有 40 个实际上不合格(观察到的负面标签)。然后 DRR = 40/50-80/100 = 0,所以没有表示偏见。

二进制、多类别平面和连续标签的 DRR 值范围为 [-1, +1]。

  • 当预测负面(拒绝)与观察到的负面结果(不合格申请人)的比率时,会出现正值D大于平面的相同比率一个. 这些值表明可能存在对偏爱的方面的偏见一个原因是在平面上发生了相对更多的虚假负面一个. 比率的差异越大,明显的偏差就越极端。

  • 当各方面的预测负面(拒绝)与观察到的负面结果(不合格申请人)的比率时,将出现接近零的值一个D具有类似的值,表明模型正在以同等精确的方式预测消极结果的观察标签。

  • 如果预测的负面(拒绝)与观察到的负面结果(不合格申请人)的比率(不合格的申请人)的比率,则会出现负值一个大于比率方面D. 这些值表明可能对不受欢迎的方面存在偏见D是因为在方面出现了相对更多的误报D. 比率的差异越为负面,明显的偏差就越极端。