优化线性学习器模型 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

优化线性学习器模型

自动模型优化(也称作超参数优化)通过运行很多在数据集上测试一系列超参数的作业来查找模型的最佳版本。您可以选择可优化超参数、每个超参数的值范围和一个目标指标。您可以从算法计算的指标中选择目标指标。自动模型优化将搜索所选超参数以找到导致优化目标指标的模型的值组合。

线性学习器算法还具有用于优化超参数的内部机制,与此处描述的自动模型优化功能无关。默认情况下,线性学习器算法通过并行训练多个模型来优化超参数。当您使用自动模型优化时,线性学习器内部优化机制功能自动关闭。这会将并行模型的数量 num_models 设置为 1。该算法会忽略您为 num_models 设置的任何值。

有关模型优化的更多信息,请参阅执行自动模型优化

由线性学习器算法计算的指标

线性学习器算法报告下表中的指标,这些指标是在训练期间计算的。选择其中一个作为目标指标。为避免过拟合,我们建议根据验证指标而不是训练指标优化模型。

指标名称 描述 优化方向
test:objective_loss

训练模型后测试数据集上的目标损失函数的平均值。默认情况下,损失是二元分类的逻辑损失和回归的平方损失。要将损失设置为其他类型,请使用 loss 超参数。

最小化

test:binary_classification_ accuracy

最终模型在测试数据集上的准确率。

最大化

test:binary_f_beta

最终模型在测试数据集上的 F_beta 分数。默认情况下,它是 F1 分数,这是查准率和查全率的调和平均数。

最大化

test:precision

最终模型在测试数据集上的查准率。如果您选择此指标作为目标,我们建议您通过将 binary_classifier_model_selection 超参数设置为 precision_at_target_recall 以及设置 target_recall 超参数的值,来设置目标查全率。

最大化

test:recall

最终模型在测试数据集上的查全率。如果您选择此指标作为目标,我们建议您通过将 binary_classifier_model_selection 超参数设置为 recall_at_target_precision 以及设置 target_precision 超参数的值,来设置目标准确率。

最大化

validation:objective_loss

每个纪元验证数据集上目标损失函数的平均值。默认情况下,损失是二元分类的逻辑损失和回归的平方损失。要将损失设置为其他类型,请使用 loss 超参数。

最小化

validation:binary_classification_accuracy

最终模型在验证数据集上的准确率。

最大化

validation:binary_f_beta

最终模型在验证数据集上的 F_beta 分数。默认情况下,F_beta 分数是 F1 分数,这是 validation:precisionvalidation:recall 指标的调和平均数。

最大化

validation:precision

最终模型在验证数据集上的查准率。如果您选择此指标作为目标,我们建议您通过将 binary_classifier_model_selection 超参数设置为 precision_at_target_recall 以及设置 target_recall 超参数的值,来设置目标查全率。

最大化

validation:recall

最终模型在验证数据集上的查全率。如果您选择此指标作为目标,我们建议您通过将 binary_classifier_model_selection 超参数设置为 recall_at_target_precision 以及设置 target_precision 超参数的值,来设置目标准确率。

最大化

优化线性学习器超参数

您可以使用以下超参数优化线性学习器模型。

参数名称 参数类型 建议的范围
wd

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

l1

ContinuousParameterRanges

MinValue: 1e-7, MaxValue: 1

learning_rate

ContinuousParameterRanges

MinValue: 1e-5, MaxValue: 1

mini_batch_size

IntegerParameterRanges

MinValue: 100, MaxValue: 5000

use_bias

CategoricalParameterRanges

[True, False]

positive_example_weight_mult

ContinuousParameterRanges

MinValue:1e-5,MaxValue1e5