

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 接受率差异 (DAR)
<a name="clarify-post-training-bias-metric-dar"></a>

接受率差异 (DAR) 指标是分面 *a* 和 *d* 的真阳性 (TP) 预测值与观测到的阳性值 (TP \+ FP) 之比的差值。该指标衡量了模型对这两个分面的接受率的预测精度差异。精度衡量的是模型从合格候选人库中识别出的合格候选人的比例。如果模型对合格申请人的预测精度在不同分面之间存在差异，这就是偏差，其大小由 DAR 来衡量。

分面 *a* 和 *d* 之间接受率差异的公式：

        DAR = TPa/(TPa \+ FPa) - TPd/(TPd \+ FPd) 

其中：
+ TPa 是分面 *a* 的真阳性预测值。
+ FPa 是分面 *a* 的假阳性预测值。
+ TPd 是分面 *d* 的真阳性预测值。
+ FPd 是分面 *d* 的假阳性预测值。

例如，假设该模型接受 70 名中年申请人（分面 *a*）申请贷款（预测阳性标签），其中只有 35 人实际被接受（观测阳性标签）。还假设该模型接受来自其他年龄人群（分面 *d*）的 100 名申请人申请贷款（预测阳性标签），其中只有 40 人实际被接受（观测阳性标签）。那么 DAR = 35/70 - 40/100 = 0.10，这表明存在不利于第二个年龄组（分面 *d*）合格人群的潜在偏差。

二进制、多类别分面和连续标签的 DAR 值范围为 [-1, \+1]。
+ 当分面 *a* 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比大于分面 *d* 的这一比率时，就会出现正值。这些值表示由于分面 *d* 中出现相对较多的假阳性，因此可能存在不利于不利分面 *d* 的偏差。比率的差异越大，表观偏差就越严重。
+ 当分面 *a* 和 *d* 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比具有相似的值时，就会出现接近零的值，这表明模型以同样的精度预测阳性结果的观测标签。
+ 当分面 *d* 的预测阳性结果（接受）与观测阳性结果（合格申请人）之比大于分面 *a* 的这一比率时，就会出现负值。这些值表示由于分面 *a* 中出现相对较多的假阳性，因此可能存在不利于有利分面 *a* 的偏差。比率的差异越负，表观偏差就越严重。