Lp-正常 (LP) - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

Lp-正常 (LP)

Lp-norm (LP) 测量训练数据集中观察到的标签的分面分布之间的 p-norm 距离。此指标是非负数指标,因此无法检测反向偏差。

L 的公式p-norm 如下所示:

        Lp(P)a,Pd) = ( ∑y||Pa - Pd||p1/p

其中点 x 和 y 之间的 p 形距定义如下:

        Lp(x, y) = (|x1-y1|p + |x2-y2|p + ... +|xn-yn|p1/p

2-norm 是欧几里德标准。假设您有一个具有三个类别的结果分配,例如,yi = {y0,y1,y2} = 大学生多类别方案中的 {accepted, waitlisted, rejected}。您获取分面 a 和 d 的结果计数之和。按以下方式计算生成的欧氏距离:

        L2(P)a,Pd) = [(n)a(0) - nd (0)2 + (n)a(1) - nd (1))2 + (n)a(2) - nd(2)2]1/2

其中:

  • na(i) 是分面 a 中第 i 个类别的结果数:例如,na(0)接受的分面数。

  • nd(i) 是分面 d 中第 i 个类别的结果数:例如,nd(2) 是分面 d 拒绝数。

    二进制、多类别和连续结果的 LP 值范围为 [0, √2),其中:

    • 值接近零表示标签的分布相似。

    • 正值表示标签分布 differences (偏差),正值越大 difference (偏差) differences (偏差)。