接受率的差异 (DAR) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

接受率的差异 (DAR)

接受率 (DAR) 指标的差异是各方面的真正正值 (TP) 预测与观察到的阳性 (TP + FP) 的比率的差异一个D. 该指标衡量了从这两个方面预测接受情况的模型的精度差异。精确度衡量模型确定的合格候选人库中合格候选人的比例。如果预测合格申请人的模型精度在各个方面之间存在差异,那么这是一种偏差,其规模由 DAR 来衡量。

各个方面之间接受率差异的公式一个D

        DAR =a/(TPa+ FPa)-TPd/(TPd+ FPd

其中:

  • TPa对于方面来说,真正的积极预测是什么?一个.

  • FPa对于方面来说,预计会出现误报吗?一个.

  • TPd对于方面来说,真正的积极预测是什么?D.

  • FPd对于方面来说,预计会出现误报吗?D.

例如,假设该模型接受 70 名中年申请人(方面)一个)用于贷款(预计正面标签),其中只有 35 个实际接受(观察到的正面标签)。还假设该模型接受来自其他年龄人口统计数据的 100 名申请人(方面D)用于贷款(预计正面标签),其中只有 40 个实际接受(观察到的正面标签)。然后 DAR = 35/70-40/100 = 0.10,这表明对第二个年龄组合格人士存在潜在偏见(方面)D)。

二进制、多类别平面和连续标签的 DAR 值范围为 [-1, +1]。

  • 如果预测的阳性(接受率)与观察到的积极结果(合格申请人)的比率(合格申请人)的比率,则会出现正值一个大于平面的相同比率D. 这些值表明可能对不受欢迎的方面存在偏见D是因为在方面出现了相对更多的误报D. 比率的差异越大,明显的偏差就越极端。

  • 当各方面的预测正值(接受率)与观察到的积极结果(合格申请人)的比率时,将出现接近零的值一个D具有类似的值,表明模型正在以同等精确的方式预测积极结果的观察标签。

  • 如果预测的正面(接受率)与观察到的积极结果(合格申请人)的比率(合格申请人)的比率,则会出现负值D大于比率方面一个. 这些值表明可能存在对偏爱的方面的偏见一个是因为在方面出现了相对更多的误报一个. 比率的差异越为负面,明显的偏差就越极端。