本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
Amazon SageMaker Autopilot 问题类型和算法支持
在使用 AutoML API 设置问题类型(例如二元分类或回归)时,您可以选择指定问题类型,也可以选择让 Amazon SageMaker Autopilot 代表您进行检测。您可以使用
CreateAutoPilot.ProblemType
参数设置问题类型。这限制了 Autopilot 尝试的预处理和算法种类。在完成作业后,如果您设置了 CreateAutoPilot.ProblemType
,ResolvedAttribute.ProblemType
将与您设置的 ProblemType
进行匹配。如果您将其留空(或 null
),则 ProblemType
将是代表您 Autopilot 做出决定的任何内容。
在某些情况下,Autopilot 无法以足够高的置信度推断 ProblemType
,在这种情况下,您必须提供值以使作业成功。
Autopilot 算法支持
Autopilot 支持三种类型的机器学习算法以解决机器学习问题:
-
线性学习器算法:一种用于解决分类或回归问题的受监督学习算法。
-
XGBoost 算法:一种指导式学习算法,它尝试将一组较简单且较弱模型的一系列估计值结合在一起,从而准确地预测目标变量。
-
深度学习算法:多层感知机 (MLP),这是一个前馈人工神经网络,可以处理不可线性解析的数据。
您无需指定用于机器学习问题的算法。Autopilot 会自动选择适当的算法进行训练。
Autopilot 问题类型
您的问题类型选项如下所示:
主题
Regression
回归根据一个或多个与其相关的其他变量或属性来估计因果目标变量的值。一个例子是预测房屋价格所使用的特征,如浴室和卧室的数量、房屋和花园的平方英尺数。回归分析可以创建一个模型,该模型将其中一个或多个特征作为输入并预测房屋价格。
二进制分类
二元分类是一种受监督的学习类型,可根据个体的属性将个体分配给两个预定义且互斥的类别之一。它受到监督,因为模型是使用示例进行训练的,其中为属性提供了正确标记的对象。基于诊断测试的结果对个人是否患有疾病的医学诊断是二元分类的一个示例。
多类别分类
多类别分类是一种受监督的学习类型,可根据个体的属性将个体分配给多个类别之一。它受到监督,因为模型是使用示例进行训练的,其中为属性提供了正确标记的对象。一个例子是预测与文本文档最相关的主题。文档可以分类为如宗教、政治或金融,或者是其他若干个预定义的主题类别之一。