召回差异 (RD) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

召回差异 (RD)

召回差异 (RD) 指标是偏爱的方面之间模型召回的差异一个而且不喜欢的方面D. 这些召回中的任何区别都是一种潜在的偏见形式。召回是真正的正值率(TPR),它衡量模型正确预测应获得积极结果的病例的频率。如果所有 y=1 的病例都是正确的预测,那么召回对于那个方面来说是完美的。当模型最大限度地减少被称为 II 型错误的假负面情况时,召回会更大。例如,两个不同群体(方面)中有多少人一个D)模型可以正确检测到应该有资格获得贷款的? 如果贷款的召回率很高一个,但贷款对方面来说很低D, 差异提供了对属于 FACET 的群体的这种偏见的一种衡量标准D.

方面召回率差异的公式一个D

        RD = TPa/(TPa+ FNa)-TPd/(TPd+ FNd) = TPRa-TPRd

其中:

  • TPa对于方面来说,真正的积极预测是什么?一个.

  • FNa是预计的错误的负面一个.

  • TPd对于方面来说,真正的积极预测是什么?D.

  • FNd是预计的错误的负面D.

  • TPRa= TPa/(TPa+ FNa) 是小平面的召回一个。或者它的真正的积极率。

  • TPRdTPd/(TPd+ FNd) 是小平面的召回D。或者它的真正的积极率。

例如,考虑以下小面的混淆矩阵:一个D.

青睐方面的混淆矩阵 a
预测 A 类 实际结果 0 实际结果 1 总计
0 20 5 25
1 10 65 75
总计 30 70 100
不喜欢的方面的混淆矩阵 d
D 类预测 实际结果 0 实际结果 1 总计
0 18 7 25
1 5 20 25
总计 23 27 50

召回差额的值为 RD = 65/70-20/27 = 0.93-0.74 = 0.19,这表示对平面存在偏见D.

面之间召回差异的值范围一个D对于二进制和多类别分类为 [-1, +1]。此指标不适用于连续标签的情况。

  • 当小平面的召回率较高时,将获得正值一个而不是分面D. 这表明该模型发现了更多的真正积极因素的方面一个而不是分面D,这是一种偏见的形式。

  • 接近零的值表明正在比较的小面的召回是类似的。这表明该模型在这两个方面都发现了大约相同数量的真正阳性,而且没有偏见。

  • 当小平面的召回率较高时,将获得负值D而不是分面一个. 这表明该模型发现了更多的真正积极因素的方面D而不是分面一个,这是一种偏见的形式。