接受率 (DAR) 差异 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

接受率 (DAR) 差异

接受率 (DAR) 指标的差异是真阳性 (TP) 预测与观察到的分面 ad 的正例 (TP + FP) 的比率之差。此指标用于衡量预测这两个分面的接受情况的模型精度的差异。精度衡量由模型确定的合格候选项池中的合格候选项的比例。如果预测符合要求的申请人的模型精度在分面之间存在差异,则这是一个偏差,其幅度由 DAR 测量。

分面 ad 之间的接受率差异的公式

        DAR = TPa/(TP)a + FPa) - TPd/(TP)d + FPd)

其中:

  • TPa 是为分面 a 预测的实际阳性。

  • FPa 是为分面 a 预测的误报。

  • TPd 是为分面 d 预测的实际阳性。

  • FPd 是为分面 d 预测的误报。

例如,假设模型接受 70 个中间年龄的申请者(分面 a)来申请(预测的正标签),其中实际接受的只有 35 个(观察到的正标签)。此外,假设模型接受 100 个来自其他期限人口统计(分面 d)的申请方,申请方为 的 ,其中的(预测的正标签)实际接受(观察到的正标签)。然后 DAR = 35/70 - 40/100 = 0.10,这表示对第二个期限组 (分面 d) 中的合格人员的潜在偏差。

二进制、多类别分面和连续标签的 DAR 的值范围为 [-1, +1]。

  • 当分面 a 的预测正数(接受数)与观察到的正结果(合格申请方)的比率大于分面 d 的相同比率时,会出现正值。这些值表示因分面 d 中出现相对更多的误报而导致对“disfarod”分面 d 的可能偏差。比率的差异越大,明显偏移越极端。

  • 当预测正数(接受数)与观察到的分面 a 的正结果(合格申请方)的比率(合格申请方)和 d 的值相似,表明模型预测的正结果的观察到的标签具有相同精度时,会出现接近零的值。

  • 当对于分面 d 观察到的正向结果(合格申请方)与分面 a 的比率大于分面 a 的比率时,会出现负值。这些值指示可能针对首选分面的偏差这是由于分面 a 中出现了相对更多的误报导致的。比率差异越负,明显偏移越极端。