语义分割超参数 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语义分割超参数

下表列出了 Amazon SageMaker 语义分割算法支持的用于网络架构、数据输入和训练的超参数。您指定语义分割训练、推理AlgorithmNameCreateTrainingJob请求.

网络架构超参数

参数名称 描述
backbone

要用于算法的编码器组件的主干。

可选

有效值:resnet-50resnet-101

默认值:resnet-50

use_pretrained_model

是否将预训练模型用于主干。

可选

有效值:TrueFalse

默认值:True

algorithm

要用于语义分割的算法。

可选

有效值:

默认值:fcn

数据超参数

参数名称 描述
num_classes

要分割的类的数量。

必填

有效值:2 ≤ 正整数 ≤ 254

num_training_samples

训练数据中的示例数。该算法使用此值来设置学习率计划程序。

必填

有效值:正整数

base_size

定义裁剪前如何重新缩放图像。图像被重新缩放,以便将长尺寸长度设置为 base_size 乘以 0.5 到 2.0 之间的随机数,并计算短尺寸以保持长宽比。

可选

有效值:正整数 > 16

默认值:520

crop_size

训练期间输入的图像大小。我们将根据 base_size 随机重新缩放输入图像,然后按照边长等于 crop_size 进行随机的方形裁剪。crop_size 将自动舍入到 8 的倍数。

可选

有效值:正整数 > 16

默认值:240

训练超参数

参数名称 描述
early_stopping

是否在训练期间使用提前停止逻辑。

可选

有效值:TrueFalse

默认值:False

early_stopping_min_epochs

必须运行的纪元的最小数量。

可选

有效值:整数

默认值:5

early_stopping_patience

在算法强制提前停止之前满足较低性能容差的纪元数。

可选

有效值:整数

默认值:4

early_stopping_tolerance

如果训练作业分数 mIOU 的相对改善小于此值,则提前停止将纪元视为未改善。仅当 early_stopping = True 时使用。

可选

有效值:0 ≤ 浮点型 ≤ 1

默认值:0.0

epochs

用于训练的纪元的数量。

可选

有效值:正整数

默认值:10

gamma1

rmsprop 的平方梯度的移动平均值的衰减系数。仅用于 rmsprop

可选

有效值:0 ≤ 浮点型 ≤ 1

默认值:0.9

gamma2

rmsprop 的动量因子。

可选

有效值:0 ≤ 浮点型 ≤ 1

默认值:0.9

learning_rate

初始学习率。

可选

有效值:0 < 浮点值 ≤ 1

默认值:0.001

lr_scheduler

学习速率计划的形状,可控制其随时间的推移而减少。

可选

有效值:

  • step:一种逐步衰减,其中学习率减少(乘以)乘以lr_scheduler_factor指定的时代之后lr_scheduler_step.

  • poly:使用多项式函数的平滑衰减。

  • cosine:使用余弦函数的平滑衰减。

默认值:poly

lr_scheduler_factor

如果lr_scheduler设置为step,该比率用来减少(倍数)learning_rate在指定的每个时代之后lr_scheduler_step. 否则为忽略。

可选

有效值:0 ≤ 浮点型 ≤ 1

默认值:0.1

lr_scheduler_step

一个以逗号分隔的时代列表,其后learning_rate将减少(乘以)乘以lr_scheduler_factor. 例如,如果值设置为"10, 20",然后learning-rate减少lr_scheduler_factor在第 10 个时代之后,再次通过这个因素在 20 个时代之后。

有条件地要求iflr_scheduler设置为step. 否则为忽略。

有效值:字符串

默认值:(无默认值,因为使用时需要该值。)

mini_batch_size

训练的批次大小。使用大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

可选

有效值:正整数

默认值:16

momentum

sgd 优化程序的动量。当您使用其他优化程序时,语义分割算法将忽略此参数。

可选

有效值:0 < 浮点值 ≤ 1

默认值:0.9

optimizer

优化程序的类型。有关优化程序的更多信息,请选择相应的链接:

可选

有效值:adamadagradnagrmspropsgd

默认值:sgd

syncbn

如果设置为 True,则为 GPU 中处理的所有样本计算批量标准化平均值和方差。

可选

有效值:TrueFalse

默认值:False

validation_mini_batch_size

验证的批次大小。大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

  • 要在不裁剪图像的情况下对整个图像的验证评分,请将此参数设置为 1。如果要整体测量整个图像的性能,请使用此选项。

    注意

    validation_mini_batch_size 参数设置为 1 会导致算法为每个图像创建一个新的网络模型。这可能会减慢验证和训练的速度。

  • 要将图像裁剪为 crop_size 参数中指定的大小,即使在评估期间,也要将此参数设置为大于 1 的值。

可选

有效值:正整数

默认值:16

weight_decay

sgd 优化程序的权重衰减系数。当您使用其他优化程序时,算法将忽略此参数。

可选

有效值:0 < 浮点型 < 1

默认值:0.0001