语义分割超参数

下表列出了 Amazon A SageMaker I 语义分割算法支持的网络架构、数据输入和训练的超参数。您可以在 CreateTrainingJob 请求的 AlgorithmName 中为训练指定语义分割。

网络架构超参数

参数名称说明

参数名称	说明
`backbone`	要用于算法的编码器组件的主干。可选有效值：`resnet-50`、`resnet-101` 默认值：`resnet-50`
`use_pretrained_model`	是否将预训练模型用于主干。可选有效值：`True`、`False` 默认值：`True`
`algorithm`	要用于语义分割的算法。可选有效值： `fcn`：全卷积网络 (FCN) 算法 `psp`：金字塔场景解析 (PSP) 算法 `deeplab`: DeepLab V3 算法默认值：`fcn`

backbone

要用于算法的编码器组件的主干。

可选

有效值：resnet-50、resnet-101

默认值：resnet-50

use_pretrained_model

是否将预训练模型用于主干。

可选

有效值：True、False

默认值：True

algorithm

要用于语义分割的算法。

可选

有效值：

默认值：fcn

数据超参数

参数名称	说明
`num_classes`	要分割的类的数量。必填有效值：2 ≤ 正整数 ≤ 254
`num_training_samples`	训练数据中的示例数。该算法使用此值来设置学习率计划程序。必填有效值：正整数
`base_size`	定义裁剪前如何重新缩放图像。图像被重新缩放，以便将长尺寸长度设置为 `base_size` 乘以 0.5 到 2.0 之间的随机数，并计算短尺寸以保持长宽比。可选有效值：正整数 > 16 默认值：520
`crop_size`	训练期间输入的图像大小。我们将根据 `base_size` 随机重新缩放输入图像，然后按照边长等于 `crop_size` 进行随机的方形裁剪。`crop_size` 将自动舍入到 8 的倍数。可选有效值：正整数 > 16 默认值：240

训练超参数

参数名称	说明
`early_stopping`	是否在训练期间使用提前停止逻辑。可选有效值：`True`、`False` 默认值：`False`
`early_stopping_min_epochs`	必须运行的纪元的最小数量。可选有效值：整数默认值：5
`early_stopping_patience`	在算法强制提前停止之前满足较低性能容差的纪元数。可选有效值：整数默认值：4
`early_stopping_tolerance`	如果训练作业分数 mIOU 的相对改善小于此值，则提前停止将纪元视为未改善。仅当 `early_stopping` = `True` 时使用。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.0
`epochs`	用于训练的纪元的数量。可选有效值：正整数默认值：10
`gamma1`	`rmsprop` 的平方梯度的移动平均值的衰减系数。仅用于 `rmsprop`。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.9
`gamma2`	`rmsprop` 的动量因子。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.9
`learning_rate`	初始学习率。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.001
`lr_scheduler`	学习率计划的形状，可控制其随时间的推移而减少。可选有效值： `step`：逐步衰减，在经过 `lr_scheduler_step` 指定的训练纪元数之后，学习率降低（乘以）`lr_scheduler_factor`。 `poly`：使用多项式函数的平滑衰减。 `cosine`：使用余弦函数的平滑衰减。默认值：`poly`
`lr_scheduler_factor`	如果 `lr_scheduler` 设置为 `step`，则为比率；在经过 `lr_scheduler_step` 指定的训练纪元数之后，`learning_rate` 降低（乘以）该比率。否则将忽略。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.1
`lr_scheduler_step`	一个逗号分隔的纪元数列表，在经过该纪元数后，`learning_rate` 减少（乘以）`lr_scheduler_factor`。例如，如果将值设置为 `"10, 20"`，则在第 10 个纪元之后，`learning-rate` 会降低 `lr_scheduler_factor`，在第 20 个纪元之后，再次降低该系数。有条件需要：如果 `lr_scheduler` 设置为 `step`。否则将忽略。有效值：字符串默认值：（没有默认值，因为使用时需要该值。）
`mini_batch_size`	训练的批次大小。使用大型 `mini_batch_size` 通常会加快训练速度，但可能会导致内存不足。内存使用率受 `mini_batch_size` 和 `image_shape` 参数的值以及主干架构的影响。可选有效值：正整数默认值：16
`momentum`	`sgd` 优化程序的动量。当您使用其他优化程序时，语义分割算法将忽略此参数。可选有效值：0 ≤ 浮点值 ≤ 1 默认值：0.9
`optimizer`	优化程序的类型。有关优化程序的更多信息，请选择相应的链接： `adam`：适应性动量估计 `adagrad`：自适应梯度下降 `nag`：Nesterov 加速梯度 `rmsprop`：均方根传播 `sgd`：随机梯度下降可选有效值：`adam`，`adagrad`，`nag`，`rmsprop`，`sgd` 默认值：`sgd`
`syncbn`	如果设置为`True`，则将对整个过程中处理的所有样本计算批量归一化均值和方差 GPUs。可选有效值：`True`、`False` 默认值：`False`
`validation_mini_batch_size`	验证的批次大小。大型 `mini_batch_size` 通常会加快训练速度，但可能会导致内存不足。内存使用率受 `mini_batch_size` 和 `image_shape` 参数的值以及主干架构的影响。要在不裁剪图像的情况下对整个图像的验证评分，请将此参数设置为 1。如果要整体测量整个图像的性能，请使用此选项。注意将 `validation_mini_batch_size` 参数设置为 1 会导致算法为每个图像创建一个新的网络模型。这可能会减慢验证和训练的速度。要将图像裁剪为 `crop_size` 参数中指定的大小，即使在评估期间，也要将此参数设置为大于 1 的值。可选有效值：正整数默认值：16
`weight_decay`	`sgd` 优化程序的权重衰减系数。当您使用其他优化程序时，算法将忽略此参数。可选有效值：0 < 浮点型 < 1 默认值：0.0001

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

语义分割

模型优化

语义分割超参数

注意