语义分割超参数 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

语义分割超参数

下表列出了 Amazon SageMaker 语义分割算法支持的网络架构、数据输入和训练的超参数。您可以在 CreateTrainingJob 请求的 AlgorithmName 中为训练指定语义分割。

网络架构超参数

参数名称 描述
backbone

要用于算法的编码器组件的主干。

可选

有效值:resnet-50resnet-101

默认值:resnet-50

use_pretrained_model

是否将预训练模型用于主干。

可选

有效值:TrueFalse

默认值:True

algorithm

要用于语义分割的算法。

可选

有效值:

默认值:fcn

数据超参数

参数名称 描述
num_classes

要分割的类的数量。

必填

有效值:2 ≤ 正整数 ≤ 254

num_training_samples

训练数据中的示例数。该算法使用此值来设置学习率计划程序。

必填

有效值:正整数

base_size

定义裁剪前如何重新缩放图像。图像被重新缩放,以便将长尺寸长度设置为 base_size 乘以 0.5 到 2.0 之间的随机数,并计算短尺寸以保持长宽比。

可选

有效值:正整数 > 16

默认值:520

crop_size

训练期间输入的图像大小。我们将根据 base_size 随机重新缩放输入图像,然后按照边长等于 crop_size 进行随机的方形裁剪。crop_size 将自动舍入到 8 的倍数。

可选

有效值:正整数 > 16

默认值:240

训练超参数

参数名称 描述
early_stopping

是否在训练期间使用提前停止逻辑。

可选

有效值:TrueFalse

默认值:False

early_stopping_min_epochs

必须运行的纪元的最小数量。

可选

有效值:整数

默认值:5

early_stopping_patience

在算法强制提前停止之前满足较低性能容差的纪元数。

可选

有效值:整数

默认值:4

early_stopping_tolerance

如果训练作业分数 mIOU 的相对改善小于此值,则提前停止将纪元视为未改善。仅当 early_stopping = True 时使用。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.0

epochs

用于训练的纪元的数量。

可选

有效值:正整数

默认值:10

gamma1

rmsprop 的平方梯度的移动平均值的衰减系数。仅用于 rmsprop

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

gamma2

rmsprop 的动量因子。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

learning_rate

初始学习率。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.001

lr_scheduler

学习率计划的形状,可控制其随时间的推移而减少。

可选

有效值:

  • step:逐步衰减,在经过 lr_scheduler_step 指定的训练纪元数之后,学习率降低(乘以)lr_scheduler_factor

  • poly:使用多项式函数的平滑衰减。

  • cosine:使用余弦函数的平滑衰减。

默认值:poly

lr_scheduler_factor

如果 lr_scheduler 设置为 step,则为比率;在经过 lr_scheduler_step 指定的训练纪元数之后,learning_rate 降低(乘以)该比率。否则将忽略。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.1

lr_scheduler_step

一个逗号分隔的纪元数列表,在经过该纪元数后,learning_rate 减少(乘以)lr_scheduler_factor。例如,如果将值设置为 "10, 20",则在第 10 个纪元之后,learning-rate 会降低 lr_scheduler_factor,在第 20 个纪元之后,再次降低该系数。

有条件需要:如果 lr_scheduler 设置为 step。否则将忽略。

有效值:字符串

默认值:(没有默认值,因为使用时需要该值。)

mini_batch_size

训练的批次大小。使用大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

可选

有效值:正整数

默认值:16

momentum

sgd 优化程序的动量。当您使用其他优化程序时,语义分割算法将忽略此参数。

可选

有效值:0 ≤ 浮点值 ≤ 1

默认值:0.9

optimizer

优化程序的类型。有关优化程序的更多信息,请选择相应的链接:

可选

有效值:adamadagradnagrmspropsgd

默认值:sgd

syncbn

如果设置为 True,则为 GPU 中处理的所有样本计算批量标准化平均值和方差。

可选

有效值:TrueFalse

默认值:False

validation_mini_batch_size

验证的批次大小。大型 mini_batch_size 通常会加快训练速度,但可能会导致内存不足。内存使用率受 mini_batch_sizeimage_shape 参数的值以及主干架构的影响。

  • 要在不裁剪图像的情况下对整个图像的验证评分,请将此参数设置为 1。如果要整体测量整个图像的性能,请使用此选项。

    注意

    validation_mini_batch_size 参数设置为 1 会导致算法为每个图像创建一个新的网络模型。这可能会减慢验证和训练的速度。

  • 要将图像裁剪为 crop_size 参数中指定的大小,即使在评估期间,也要将此参数设置为大于 1 的值。

可选

有效值:正整数

默认值:16

weight_decay

sgd 优化程序的权重衰减系数。当您使用其他优化程序时,算法将忽略此参数。

可选

有效值:0 < 浮点型 < 1

默认值:0.0001