本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
线性学习器超参数
下表包含线性学习器算法的超参数。这些是由用户设置的参数,以便于从数据中评估模型参数。首先,按字母顺序列出必须设置的所需超参数。接下来,也按字母顺序列出可以设置的可选超参数。当超参数设置为时auto
,Amazon SageMaker 将自动计算并设置该超参数的值。
参数名称 | 描述 |
---|---|
num_classes |
响应变量的分类数量。该算法假定分类标记为
有效值:从 3 到 1000000 的整数 |
predictor_type |
将目标变量的类型指定为二元分类、多元分类或回归。 必填 有效值: |
accuracy_top_k |
当计算多元分类的前 k 个最大数准确率指标时,为 k 的值。如果模型将前 k 个最大数分数中的一个分配给实际标签,则将示例评分为正确。 可选 有效值:正整数 默认值:3 |
balance_multiclass_weights |
指定是否使用分类权重,这使得每个分类在损失函数中具有相同的重要性。仅当 可选 有效值: 默认值: |
beta_1 |
一阶矩估计的指数衰减率。仅当 可选 有效值: 默认值: |
beta_2 |
二阶矩估计的指数衰减率。仅当 可选 有效值: 默认值: |
bias_lr_mult |
允许偏移项有不同的学习率。偏移的实际学习率是 可选 有效值: 默认值: |
bias_wd_mult |
允许偏移项有不同的正则化。偏移的实际 L2 正则化权重是 可选 有效值: 默认值: |
binary_classifier_model_selection_criteria |
当
可选 有效值: 默认值: |
early_stopping_patience |
如果在相关指标中没有改进,则在结束训练前等待的纪元数。如果您提供了 binary_classifier_model_selection_criteria 的值,则指标就是该值。否则,指标与为 loss 超参数指定的值相同。该指标是在验证数据上评估的。如果未提供验证数据,则该指标始终与为 可选 有效值:正整数 默认值:3 |
early_stopping_tolerance |
用于评估损失改善的相对容差。如果损失改善除以上一个最佳损失的比率小于此值,则提前停止逻辑会认为改善是零。 可选 有效值:正的浮点整数 默认值:0.001 |
epochs |
扫描训练数据的最大次数。 可选 有效值:正整数 默认值:15 |
f_beta |
在计算二元分类或多元分类的 F 分数指标时使用的 Beta 值。如果为 可选 有效值:正的浮点整数 默认值:1.0 |
feature_dim |
输入数据中的特征数。 可选 有效值: 默认值: |
huber_delta |
用于 Huber 损失的参数。在训练和指标评估过程中,对小于增量的错误计算 L2 损失,对大于增量的错误计算 L1 损失。 可选 有效值:正的浮点整数 默认值:1.0 |
init_bias |
偏移项的初始权重。 可选 有效值:浮点整数 默认值:0 |
init_method |
设置用于模型权重的初始分布函数。函数包括:
可选 有效值: 默认值: |
init_scale |
扩展模型权重的初始均匀分布。仅当 可选 有效值:正的浮点整数 默认值:0.07 |
init_sigma |
正态分布的初始标准差。仅当 可选 有效值:正的浮点整数 默认值:0.01 |
l1 |
L1 正则化参数。如果不希望使用 L1 正则化,请将此值设置为 0。 可选 有效值: 默认值: |
learning_rate |
优化程序用于参数更新的步长。 可选 有效值: 默认值: |
loss |
指定损失函数。 可用的损失函数及其默认值取决于
有效值: 可选 默认值: |
loss_insensitivity |
epsilon 不敏感损失类型的参数。在训练和指标评估过程中,任何小于此值的误差都被认为是零。 可选 有效值:正的浮点整数 默认值:0.01 |
lr_scheduler_factor |
对于每个 可选 有效值: 默认值: |
lr_scheduler_minimum_lr |
学习率降低到的值永远不会低于为 可选 有效值: 默认值: |
lr_scheduler_step |
学习率下降之间的步骤数。仅当 可选 有效值: 默认值: |
margin |
可选 有效值:正的浮点整数 默认值:1.0 |
mini_batch_size |
用于数据迭代器的每个小批量的观察次数。 可选 有效值:正整数 默认值:1000 |
momentum |
可选 有效值: 默认值: |
normalize_data |
在训练之前标准化特征数据。数据标准化将各个特征的数据转换为具有平均值零并进行缩放以获得单位标准偏差。 可选 有效值: 默认值: |
normalize_label |
对标签进行标准化。标签标准化将标签移动到平均值零,并将其缩放为具有单位标准偏差。
可选 有效值: 默认值: |
num_calibration_samples |
验证数据集中用于模型校准的观察次数(在查找最佳阈值时)。 可选 有效值: 默认值: |
num_models |
并行训练的模型数。对于默认值 可选 有效值: 默认值: |
num_point_for_scaler |
用于计算标准化或取消偏移项的数据点数量。 可选 有效值:正整数 默认值:10,000 |
optimizer |
要使用的优化算法。 可选 有效值:
默认值: |
positive_example_weight_mult |
在训练二元分类器时分配给正示例的权重。负示例的权重固定为 1。如果您希望算法选择一个权重,以使分类负示例与 正示例时发生的错误对训练损失有相同的影响,请指定 可选 有效值: 默认值:1.0 |
quantile |
分位数损失的分位数。对于分位数 q,模型将尝试生成预测,以便 可选 有效值:0 和 1 之间的浮点整数值 默认值:0.5 |
target_precision |
目标查准率。如果 可选 有效值:0 和 1.0 之间的浮点整数值 默认值:0.8 |
target_recall |
目标查全率。如果 可选 有效值:0 和 1.0 之间的浮点整数值 默认值:0.8 |
unbias_data |
在训练前对特性取消偏移以使平均值为 0。默认情况下,如果 可选 有效值: 默认值: |
unbias_label |
在训练前对标签取消偏移以使平均值为 0。仅当 可选 有效值: 默认值: |
use_bias |
指定模型是否应包含偏移项,即线性等式中的截距项。 可选 有效值: 默认值: |
use_lr_scheduler |
是否对学习率使用计划程序。如果要使用计划程序,请指定 可选 有效值: 默认值: |
wd |
权重衰减参数,也称为 L2 正则化参数。如果不希望使用 L2 正则化,请将此值设置为 0。 可选 有效值: 默认值: |