不同的影响力 (DI) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

不同的影响力 (DI)

可以以比率的形式评估预测标签指标中的正比例差异。

预测标签指标中正比例的比较可以以比率的形式进行评估,而不是像与预测标签中的正比例差异 (DPPL). 不同影响 (DI) 指标的定义是平面积极预测的比例 (y=1)D超过了平面积极预测的比例(Y=1)一个. 例如,如果模型预测向 60% 的中年群体提供贷款(方面)一个)和 50% 的其他年龄组(方面)D),然后是 DI = .5/.6 = 0.8,这表明对以方面为代表的另一个老年人群有积极的偏见和不利影响D.

预测标签比例的公式:

        DI = q'd/q 'a

其中:

  • Q 'an'a(1)/na是平面的预测比例一个他们得到了价值 1 的积极结果。在我们的例子中,预计将获得贷款的中年方面的比例。n'a(1)表示 facet 的成员数一个谁得到了积极的预测结果和 na是 Facet 的成员数量一个.

  • Q 'dn'd(1)/nd是平面的预测比例Da 谁得到了价值 1 的积极结果。在我们的例子中,预计将获得贷款的老年人和年轻人的一个方面。n'd(1)表示 facet 的成员数D谁得到了积极的预测结果和 nd是 Facet 的成员数量D.

对于二进制、多类别平面和连续标签,DI 值在区间 [0, ∞) 范围内。

  • 值小于 1 表示该小面一个预计积极结果的比例高于方面D. 这被称为正偏差.

  • 值为 1 表示人口均等。

  • 值大于 1 表示该小平面D预计积极结果的比例高于方面一个. 这被称为负偏差.