科尔莫戈罗夫-斯米尔诺夫 (KS) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

科尔莫戈罗夫-斯米尔诺夫 (KS)

科尔莫戈罗夫-斯米尔诺夫偏置度量 (KS) 等于小平面分布中标签之间的最大差异aD的数据集。SageMaker Clelity 实施的双样本 KS 测试通过找到最不平衡的标签来补充标签不平衡的其他措施。

科尔莫戈罗夫-斯米尔诺夫指标的公式如下:

        KS = 最大值(|Pa(y)-Pd(y) |)

例如,假设一组申请人(面a)到大学被拒绝,等候名单,或接受分别为 40%,40%,20%,而这些利率对于其他申请人(面D)是 20%,10%,70%。然后,科尔莫戈罗夫-斯米尔诺夫偏置度量值如下所示:

确定值 = 最大值(0.4-0.2 |、0.4-0.1|、0.1|、0.2-0.7|)= 0.5

这告诉我们,面分布之间的最大差异为 0.5,并且发生在验收率中。公式中有三个项,因为标注是基数三的多类。

二进制结果、多重结果和连续结果的 LP 值范围为 [0, +1],其中:

  • 接近零的值表示标签在所有结果类别中的小平面之间均匀分布。例如,申请贷款的两个方面都得到了 50% 的接受和 50% 的拒绝。

  • 1 附近的值表示一个结果的标签都在一个面中。例如,a得到 100% 的接受和方面D没有。

  • 间歇性值表示最大标签不平衡的相对程度。