用于说明的 SAP 基准 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

用于说明的 SAP 基准

如前文所述,解释通常是对比性的 (即,它们考虑的是偏离基准的情况)。因此,对于相同的模型预测,对于不同的基准,您可以预期得到不同的解释,因此,关键是选择基准。在 ML 上下文中,基准对应于一个可能是无信息性或信息性的假想实例。在计算 Shapley 值期间, 会在基准和给定实例之间SageMaker Clarify生成多个新实例,其中通过将特征值设置为基准的特征值来对特征的缺失进行建模,通过将特征值设置为给定实例的特征值来对特征的缺失进行建模。因此,所有特征的缺失与基准对应,并且所有特征的存在与给定实例对应。

如何选择好的基准? 通常,需要选择包含非常低信息内容的基准。例如,您可以通过获取数值特征的中值或平均值以及分类特征的模式,从训练数据集中构造平均实例。对于大学准入示例,您可能有兴趣说明为什么接受特定学生,而不是基于平均学生的基准接受。

或者,您可以选择生成有关信息性基准的说明。对于大学准入方案,您可能希望说明为什么在与来自相似人口统计背景的其他申请人进行比较时拒绝特定学生。在这种情况下,您可以选择一个表示感兴趣的应用者的基准,即来自类似的人口统计背景的应用者。因此,您可以使用信息性基准将分析集中在特定模型预测的特定方面。您可以通过将您无法对其采取行动的人口统计属性和其他特征设置为与给定实例中的相同值来隔离这些特征以进行评估。