本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
AutoGluon-表格超参数
下表包含 Amazon A  SageMaker  I  AutoGluon-Tabular 算法所需或最常用的超参数子集。用户可以设置这些参数,以便于从数据中估算模型参数。 SageMaker AI  AutoGluon-Tabular 算法是开源AutoGluon表格包的实现。
注意
默认超参数基于 AutoGluon-表格样本笔记本中的示例数据集。
默认情况下, SageMaker AI  AutoGluon-Tabular 算法会根据分类问题的类型自动选择评估指标。该算法根据数据中的标签数量来检测分类问题的类型。对于回归问题,评估指标为均方根误差。对于二元分类问题,评估指标是接收器操作特性曲线 (AUC) 下方的面积。对于多元分类问题,评估指标是准确性。您可以使用 eval_metric 超参数来更改默认评估指标。有关  AutoGluon-Tabular 超参数的更多信息,包括描述、有效值和默认值,请参阅下表。
| 参数名称 | 描述 | 
|---|---|
eval_metric | 
                        
                             验证数据的评估指标。如果  
 有效值:字符串,有关有效值,请参阅AutoGluon 文档 默认值:  | 
                    
presets | 
                        
                             
 
 有关更多详细信息,请参阅AutoGluon 预测变量。 有效值:字符串,以下任意值:( 默认值:  | 
                    
auto_stack | 
                        
                             是否 AutoGluon 应自动使用装袋和多层堆叠组合来提高预测精度。如果您愿意承受更长的训练时间以最大限度地提高预测精度,请将  有效值:字符串, 默认值:  | 
                    
num_bag_folds | 
                        
                             用于模型装袋的折叠次数。 有效值:字符串,介于  默认值:  | 
                    
num_bag_sets | 
                        
                             要执行的 k-折装袋重复次数(值必须大于或等于 1)。装袋期间模型训练总次数等于  有效值:整数,范围:[ 默认值:  | 
                    
num_stack_levels | 
                        
                             堆栈集合中使用的堆叠层数。模型训练时间大致增加  有效值:浮点型,范围:[ 默认值:  | 
                    
refit_full | 
                        
                             正常训练过程结束后,是否在所有数据(训练和验证)上重新训练所有模型。有关更多详细信息,请参阅AutoGluon 预测变量。 有效值:字符串, 默认值:  | 
                    
set_best_to_refit_full | 
                        
                             是否更改预测器用于预测的默认模型。如果  有效值:字符串, 默认值:  | 
                    
save_space | 
                        
                             是否需要删除在新数据上进行预测所不需要的辅助模型文件,从而减少预测器所用的内存和磁盘大小。这对推理精度没有影响。如果唯一的目标是使用训练后的模型进行预测,我们建议将  有效值:字符串, 默认值:  | 
                    
verbosity | 
                        
                             打印消息的详细程度。 有效值:整数,以下任意值:( 默认值:  |