语义分割超参数 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语义分割超参数

以下各表列出了 Amazon SageMaker 语义分割算法支持的用于网络架构、数据输入和训练的超参数。您可以在AlgorithmName请求的 中为训练指定CreateTrainingJob语义分割

网络架构超参数

参数名称 描述
backbone

要用于算法的编码器组件的主干。

可选

有效值:resnet-50resnet-101

默认值: resnet-50

use_pretrained_model

是否将预训练模型用于主干。

可选

有效值:TrueFalse

默认值: True

algorithm

要用于语义分割的算法

可选

有效值:

默认值: fcn

数据超参数

参数名称 描述
num_classes

要分割的类的数量。

必需

有效值:2 ≤ 正整数 ≤ 254

num_training_samples

训练数据中的示例数。该算法使用此值来设置学习率计划程序。

必需

有效值:正整数

base_size

定义裁剪前如何重新缩放图像。图像被重新缩放,以便将长尺寸长度设置为 base_size 乘以 0.5 到 2.0 之间的随机数,并计算短尺寸以保持长宽比。

可选

有效值:正整数 > 16

默认值:520

crop_size

训练期间输入的图像大小。我们将基于 随机重新缩放输入图像base_size,然后执行边长等于 的随机方块裁剪crop_sizecrop_size 将自动舍入到 8 的倍数。

可选

有效值:正整数 > 16

默认值:240

训练超参数

参数名称 描述
early_stopping

是否在训练期间使用提前停止逻辑。

可选

有效值:TrueFalse

默认值: False

early_stopping_min_epochs

必须运行的纪元的最小数量。

可选

有效值:整数

默认值:5

early_stopping_patience

在算法强制提前停止之前满足较低性能容差的纪元数。

可选

有效值:整数

默认值:4

early_stopping_tolerance

如果训练作业分数 mIOU 的相对改善小于此值,则提前停止将纪元视为未改善。仅当 early_stopping = = True. 时使用。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.0

epochs

用于训练的纪元的数量。

可选

有效值:正整数

调整渲染效果的缩放。

gamma1

的平方梯度的移动平均值的衰减系数rmsprop。 仅用于 rmsprop

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

gamma2

的动量因子。rmsprop.

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

learning_rate

初始学习率。

可选

有效值:0 < 浮点型 ≤ 1

默认值:0.001

lr_scheduler

学习速率计划的形状,可控制其随时间的推移而减少。

可选

有效值:

  • step:一种分步衰减,其中学习率在 指定的纪元lr_scheduler_factor后按 减少(乘以lr_scheduler_step)。

  • poly:使用多项式函数的平滑衰减。

  • cosine:使用余弦函数的平滑衰减。

默认值: poly

lr_scheduler_factor

如果 lr_scheduler 设置为 step,则为在 指定的每个纪元learning_rate后减少 (乘数) 的比率lr_scheduler_step。 否则,将忽略 。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.1

lr_scheduler_step

一个用逗号分隔的纪元列表,之后 被 learning_rate 减少(乘以lr_scheduler_factor)。 例如,如果 值设置为 "10, 20",则learning-rate在第 10th 个纪元lr_scheduler_factor之后将 减少 ,在第 20th纪元之后将再次减小此系数。

按条件,如果 设置为 ,则是必需的lr_schedulerstep。 否则,将忽略 。

有效值:字符串

默认值:(无默认值,因为使用时需要该值。)

mini_batch_size

训练的批次大小。使用大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

可选

有效值:正整数

默认值:16

momentum

sgd 优化程序的动量。当您使用其他优化程序时,语义分割算法将忽略此参数。

可选

有效值:0 < 浮点型 ≤ 1

默认值:0.9

optimizer

优化程序的类型。有关优化程序的更多信息,请选择相应的链接:

可选

有效值:adamadagradnagrmspropsgd

默认值: sgd

syncbn

如果设置为 True,则会跨 处理的所有样本计算批量标准化平均值和方差GPUs。

可选

有效值:TrueFalse

默认值: False

validation_mini_batch_size

验证的批次大小。大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

  • 要在不裁剪图像的情况下对整个图像的验证评分,请将此参数设置为 1。如果要整体测量整个图像的性能,请使用此选项。

    注意

    validation_mini_batch_size 参数设置为 1 会导致算法为每个图像创建一个新的网络模型。这可能会减慢验证和训练的速度。

  • 要将图像裁剪为 crop_size 参数中指定的大小,即使在评估期间,也要将此参数设置为大于 1 的值。

可选

有效值:正整数

默认值:16

weight_decay

sgd 优化程序的权重衰减系数。当您使用其他优化程序时,算法将忽略此参数。

可选

有效值:0 < 浮点型 < 1

默认值:0.0001