检测训练后数据和模型偏差 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

检测训练后数据和模型偏差

训练后偏差分析有助于揭示可能源于数据偏差或分类和预测算法引入的偏差所产生的偏差。这些分析将考虑数据,包括标签和模型的预测。您可以通过分析预测标签或将预测值与具有不同属性的组的数据中观测到的目标值进行比较来评估性能。有不同的公平概念,每个概念都需要不同的偏差衡量标准。

有些法律的公平概念可能并不容易捕捉,因为它们很难发现。例如,美国的不同影响的概念,发生在一个群体,称为一个不太受欢迎的方面D, 即使所采取的做法似乎是公平的, 也会受到不利影响. 这种类型的偏差可能不是由于机器学习模型造成的,但仍可通过训练后偏差分析检测到。

Amazon SageMaker 澄清试图确保术语的使用一致。有关术语及其定义的列表,请参阅Amazon SageMaker 澄清偏见和公平条款.

有关训练后偏差指标的其他信息,请参阅金融领域 Machine Learning 的公平措施.

示例笔记本

Amazon SageMaker 澄清提供了以下示例笔记本用于训练后偏差检测:

此笔记本电脑已经验证仅在 Amazon SageMaker 工作室中运行。如果您需要有关如何在 Amazon SageMaker Studio 中打开笔记本的说明,请参阅创建或打开 Amazon SageMaker 工作室笔记本电脑. 如果系统提示您选择内核,请选择Python 3(数据科学).