Lp-范数 (LP) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Lp-范数 (LP)

Lp-范数 (LP) 衡量训练数据集中观测标签的分面分布之间的 p-范数距离。该指标为非负值,因此无法检测到反向偏差。

Lp-范数的公式如下:

        Lp(Pa, Pd) = ( ∑y||Pa - Pd||p)1/p

其中,点 x 和 y 之间的 p-范数距离定义如下:

        Lp(x, y) = (|x1-y1|p + |x2-y2|p + … +|xn-yn|p)1/p

2-范数是欧几里得范数。假设结果分布有三个类别,例如,在大学录取多类别场景中,yi = {y0, y1, y2} = {录取, 候补, 拒绝}。取分面 ad 的结果计数之差的平方和。由此得出的欧几里得距离计算如下:

        L2(Pa, Pd) = [(na(0) - nd(0))2 + (na(1) - nd(1))2 + (na(2) - nd(2))2]1/2

其中:

  • na(i) 是分面 a 中第 i 个类别结果的数量:例如 na(0) 是分面 a 的接受次数。

  • nd(i) 是分面 d 中第 i 个类别结果的数量:例如 nd(2) 是分面 d 的拒绝次数。

    二进制、多类别和连续结果的 LP 值范围为 [0, √2),其中:

    • 接近零的值意味着标签的分布情况相似。

    • 正值表示标签分布存在差异,正值越大,差异就越大。