本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
解释功能报告
Amazon A SageMaker utopilot 提供可解释性报告,以帮助解释最佳候选模型是如何预测文本分类问题的。该报告可以帮助 ML 工程师、产品经理和其他内部利益相关者了解模型的特征。机器学习的透明度决定了使用方和监管机构是否信任和解释根据模型预测做出的决策。您可以将这些解释用于审计目的和满足监管要求,建立对模型的信任,支持人工决策,以及用于调试和提高模型性能。
文本分类的 Autopilot 解释功能使用积分梯度这种公理归因方法。这种方法依赖于深度网络的公理归因
Autopilot 生成 JSON 文件格式的解释功能报告。该报告包含基于验证数据集的分析详细信息。用于生成报告的每个样本都包含以下信息:
-
text
:已解释的输入文本内容。 -
token_scores
:文本中每个令牌的分数列表。 -
-
attribution
:描述令牌重要性的分数。 -
description.partial_text
:表示令牌的部分子字符串。
-
-
predicted_label
:最佳候选模型预测的标签类。 -
probability
:所预测predicted_label
的置信度。
在对 DescribeAutoMLJobV2
响应的 BestCandidate.CandidateProperties.CandidateArtifactLocations.Explainability
位置,您可以找到为最佳候选项生成的解释功能构件的 Amazon S3 前缀。
以下是在解释功能构件中提供的分析内容的示例。
{ "text": "It was a fantastic movie!", "predicted_label": 2, "probability": 0.9984835, "token_scores": [ { "attribution": 0, "description": { "partial_text": "It" } }, { "attribution": -0.022447118861679088, "description": { "partial_text": "was" } }, { "attribution": -0.2164326456817965, "description": { "partial_text": "a" } }, { "attribution": 0.675, "description": { "partial_text": "fantastic" } }, { "attribution": 0.416, "description": { "partial_text": "movie!" } } ] }
在这个 JSON 报告示例中,解释功能对文本 It was a fantastic movie!
进行评估,并对其每个令牌对总体预测标签的贡献进行评分。预测的标签是 2
,这是一种强烈的积极情绪,概率为 99.85%。然后,JSON 样本详细说明了每个令牌对该预测的贡献。例如,令牌 fantastic
比令牌 was
具有更强的归因。它是对最终预测贡献最大的令牌。