数据格式兼容性指南 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

数据格式兼容性指南

本指南描述了与 Clarify 处理作业兼容的数据格式类型。 SageMaker 支持的数据格式类型包括文件扩展名、数据结构以及对表格和图像数据集的特定要求或限制。本指南还介绍如何检查您的数据集是否符合这些要求。

总体而言,Clarif SageMaker y 处理作业遵循输入-过程-输出模型来计算偏差指标和特征归因。有关详细信息,请参阅以下示例。

Clarif SageMaker y 处理作业的输入包括以下内容:

  • 要分析的数据集。

  • 分析配置。有关如何配置分析的更多信息,请参阅配置分析

在处理阶段,Clari SageMaker fy 会计算偏差指标和特征归因。C SageMaker larify 处理任务在后端完成以下步骤:

  • Cl SageMaker arify 处理任务解析您的分析配置并加载您的数据集

  • 要计算训练后偏差指标和特征归因,该作业需要从模型中进行模型预测。Cl SageMaker arify 处理任务会序列化您的数据,并将其作为请求发送到部署在 SageMaker 实时推理端点上的模型。之后,Clari SageMaker fy 处理任务会从响应中提取预测。

  • C SageMaker larify 处理作业执行偏差和可解释性分析,然后输出结果。

有关更多信息,请参阅 SageMaker 澄清处理任务的工作原理

用于指定数据格式的参数取决于在处理流程中使用数据的位置,如下所示:

  • 对于输入数据集,请使用 dataset_type 参数指定格式或 MIME 类型。

  • 对于向端点发出的请求,请使用 content_type 参数指定格式。

  • 对于来自端点的响应,请使用 accept_type 参数指定格式。

输入数据集、向端点发出的请求以及来自端点的响应无需采用相同格式。例如,在满足以下条件的情况下,您可以使用带有 CSV 请求负载和 JSON 行响应负载的 Parquet 数据集。

  • 您的分析得到正确配置。

  • 您的模型支持请求和响应格式。

注意

如果未提供content_typeaccept_type未提供,则 Clarif SageMaker y 容器会推断出content_type和。accept_type