创建特征属性基准和可解释性报告 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建特征属性基准和可解释性报告

有关说明如何在 Studio 中运行SageMaker Clarify处理作业(该作业可为其相对于基准的预测创建说明)的示例笔记本,请参阅 Amazon SageMaker Clarify的可解释性和偏差检测。

如果您需要有关如何在 Amazon SageMaker Studio 中打开笔记本的说明,请参阅创建或打开 Amazon SageMaker Studio 笔记本。以下代码示例取自之前列出的示例笔记本。本节讨论与使用 Shapley 值相关的代码,这些代码提供比较每个特征进行预测的相对贡献的报告。

使用 SHAPConfig 创建基准。在此示例中, mean_abs 是所有实例的绝对 SAP 值的平均值,指定为基准。您可以使用 DataConfig 配置目标变量、数据输入和输出路径及其格式。

shap_config = clarify.SHAPConfig(baseline=[test_features.iloc[0].values.tolist()], num_samples=15, agg_method='mean_abs') explainability_output_path = 's3://{}/{}/clarify-explainability'.format(bucket, prefix) explainability_data_config = clarify.DataConfig(s3_data_input_path=train_uri, s3_output_path=explainability_output_path, label='Target', headers=training_data.columns.to_list(), dataset_type='text/csv')

然后运行可解释性作业。

clarify_processor.run_explainability(data_config=explainability_data_config, model_config=model_config, explainability_config=shap_config)

在 Studio 中查看结果或从 explainability_output_path S3 存储桶下载结果。