创建要素属性基线和解释性报告 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建要素属性基线和解释性报告

有关如何在 Studio 中运行 SageMaker Clear 处理作业(该作业为其相对于基线的预测创建说明)的说明的示例笔记本,请参阅使用 Amazon SageMaker 进行解释和偏差检测.

如果您需要有关在 Amazon SageMaker Studio 中打开笔记本的说明,请参阅以及创建或打开 Amazon SageMaker 工作室笔记本电脑. 以下代码示例来自以前列出的笔记本示例。本节讨论与使用 Shapley 值相关的代码,以提供比较每个要素所做预测的相对贡献的报告。

使用SHAPConfig以创建基线。在此示例中,mean_abs是指定为基线的所有实例的绝对 SHAP 值的均值。您使用DataConfig配置目标变量、数据输入和输出路径及其格式。

shap_config = clarify.SHAPConfig(baseline=[test_features.iloc[0].values.tolist()], num_samples=15, agg_method='mean_abs') explainability_output_path = 's3://{}/{}/clarify-explainability'.format(bucket, prefix) explainability_data_config = clarify.DataConfig(s3_data_input_path=train_uri, s3_output_path=explainability_output_path, label='Target', headers=training_data.columns.to_list(), dataset_type='text/csv')
注意

SageMaker 澄清中的内核 SHAP 支持省略 “基线” 参数。在这种情况下,将自动生成基于对输入数据集进行聚类的基线。

然后运行解释作业。

clarify_processor.run_explainability(data_config=explainability_data_config, model_config=model_config, explainability_config=shap_config)

在 Studio 中查看结果,或从explainability_output_pathS3 存储桶。