拒绝率的差异 (DRR) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

拒绝率的差异 (DRR)

抑制率 (DRR) 度量的差异是实际负值 (TN) 预测值与观测到的负值 (TN + FN) 之间的差异aD. 此度量测量模型精度的差异,用于预测这两个方面的拒绝。精确度度量模型确定的不合格候选人库中不合格候选人的比例。如果用于预测不合格申请人的模型精度在各面之间发生偏差,则这是一种偏差,其幅度由 DRR 测量。

各面之间拒绝率差异的公式aD

        德雷尔 = 田纳d/(田纳d+ FNd)-田纳西a/(田纳a+ FNa

其中:

  • TNd是预测面的真正负面D.

  • FNd是预测方面的虚假负面D.

  • TPa是预测面的真正负面a.

  • FNa是预测方面的虚假负面a.

例如,假设模型拒绝 100 名中年申请人(a)用于贷款(预测负标签),其中 80 人实际上是不合格的(观察到的负面标签)。另外假设该模型接受来自其他年龄人口统计的 50 申请人(方面D)用于贷款(预计负标签),其中只有 40 个实际上是不合格的(观察到的负面标签)。然后 DRR = 40/50-80/100 = 0,因此没有指示偏差。

二进制、多面和连续标签的 DRR 值范围为 [-1, +1]。

  • 当预测负面(拒绝)与观察到的负面结果(不合格的申请人)的比率时,会出现正值D大于小平面的相同比例a. 这些值表示可能对偏好的方面存在偏差a引起的相对较多的假负面的发生a. 比率的差异越大,明显的偏差就越极端。

  • 当预测负面(拒绝)与观察到的负面结果(不合格的申请人)的比率时,会出现接近零的值aD具有相似的值,表明模型以相同的精度预测负结果的观测标签。

  • 当预测负值(拒绝)与观察到的负面结果(不合格的申请人)的比率时,会出现负值a大于比率小平面D. 这些值表示可能对不偏向的面存在偏差D由于相对较多的误报发生而引起的切面D. 比率的差异越负,明显的偏差就越极端。