本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 文本分类- TensorFlow 超参数
<a name="text-classification-tensorflow-Hyperparameter"></a>

超参数是在机器学习模型开始学习之前设置的参数。Amazon A SageMaker I 内置的对象检测- TensorFlow 算法支持以下超参数。有关超参数调整的信息，请参阅[调整文本分类- TensorFlow 模型](text-classification-tensorflow-tuning.md)。


| 参数名称 | 说明 | 
| --- | --- | 
| batch\_size | 训练的批次大小。对于具有多个实例的训练 GPUs，此批量大小用于整个 GPUs。<br />有效值：正整数。<br />默认值：`32`。 | 
| beta\_1 | `"adam"` 和 `"adamw"` 优化器的 beta1。表示一阶矩估计的指数衰减率。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.9`。 | 
| beta\_2 | `"adam"` 和 `"adamw"` 优化器的 beta2。表示二阶矩估计的指数衰减率。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.999`。 | 
| dropout\_rate | 顶层分类层中丢弃层的丢弃比率。仅在 `reinitialize_top_layer` 设置为 `"True"` 时使用。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.2` | 
| early\_stopping | 设置为 `"True"` 可在训练期间使用提前停止逻辑。设置为 `"False"` 则不使用提前停止。<br />有效值：字符串，以下任意值：（`"True"` 或 `"False"`）。<br />默认值：`"False"`。 | 
| early\_stopping\_min\_delta | 认定为有所改进的所需的最小变化。小于值 early\_stopping\_min\_delta 的绝对变化不会认定为改进。仅在 early\_stopping 设置为 "True" 时使用。有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.0`。 | 
| early\_stopping\_patience | 继续训练而没有改善的纪元数。仅在 `early_stopping` 设置为 `"True"` 时使用。<br />有效值：正整数。<br />默认值：`5`。 | 
| epochs | 训练纪元数。<br />有效值：正整数。<br />默认值：`10`。 | 
| epsilon | `"adam"`、`"rmsprop"`、`"adadelta"`、`"adagrad"` 优化器的 ε。通常设置为较小的值，以避免被 0 除。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`1e-7`。 | 
| initial\_accumulator\_value | 累加器的起始值，对于 `"adagrad"` 优化器，为每个参数的动量值。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.0001`。 | 
| learning\_rate | 优化器的学习率。有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.001`。 | 
| momentum | `"sgd"` 和 `"nesterov"` 优化器的动量。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.9`。 | 
| optimizer | 优化程序类型。有关更多信息，请参阅 TensorFlow 文档中的[优化器](https://www.tensorflow.org/api_docs/python/tf/keras/optimizers)。<br />有效值：字符串，以下任意值：（`"adamw"`、`"adam"`、`"sgd"`、`"nesterov"`、`"rmsprop"`、` "adagrad"`、`"adadelta"`）。<br />默认值：`"adam"`。 | 
| regularizers\_l2 | 分类层中密集层的 L2 正则化因子。仅在 `reinitialize_top_layer` 设置为 `"True"` 时使用。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.0001`。 | 
| reinitialize\_top\_layer | 如果设置为 `"Auto"`，则在微调期间将重新初始化顶层分类层参数。对于增量训练，除非设置为 `"True"`，否则不会重新初始化顶层分类层参数。<br />有效值：字符串，以下任意值：（`"Auto"`、`"True"` 或 `"False"`）。<br />默认值：`"Auto"`。 | 
| rho | `"adadelta"` 和 `"rmsprop"` 优化器的梯度的折扣系数。对其他优化程序则忽略。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.95`。 | 
| train\_only\_on\_top\_layer | 如果为 `"True"`，则仅对顶层分类层参数进行微调。如果为 `"False"`，则对所有模型参数进行微调。<br />有效值：字符串，以下任意值：（`"True"` 或 `"False"`）。<br />默认值：`"False"`。 | 
| validation\_split\_ratio | 为创建验证数据而随机拆分的训练数据比例。仅在未通过 `validation` 通道提供验证数据时使用。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.2`。 | 
| warmup\_steps\_fraction | 梯度更新步骤总数中的一部分，作为预热，学习率从 0 增加到初始学习率。仅与 `adamw` 优化器一起使用。<br />有效值：浮点型，范围：[`0.0`，`1.0`]。<br />默认值：`0.1`。 |