DeepAR 超参数 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

DeepAR 超参数

参数名称 描述
context_length

模型在进行预测之前获取以查看的时间点数。此参数的值应与 大致相同prediction_length。 该模型还从目标接收滞后的输入,因此 context_length可能比典型季节性小得多。例如,每日时间序列可以具有每年的季节性。该模型自动包括一年的滞后,因此上下文长度可以短于一年。模型选取的滞后值取决于时间序列的频率。例如,每日频率的滞后值为前一周、前两周、前三周、4 周和前一年。

必需

有效值:正整数

epochs

扫描训练数据的最大次数。最佳值取决于您的数据大小和学习率。另请参阅early_stopping_patience。 典型值范围为 10 到 1000。

必需

有效值:正整数

prediction_length

训练模型进行预测的时间步长数,也称为预测范围。训练后的模型始终生成此长度的预测。它无法生成更长的预测。在训练模型时prediction_length, 已修复,以后无法更改。

必需

有效值:正整数

time_freq

数据集中时间序列的粒度。使用 time_freq 选择适当的日期特征和滞后。该模型支持以下基本频率。它还支持这些基本频率的倍数。例如, 5min 指定频率为 5 分钟。

  • M:每月

  • W:每周

  • D:每天

  • H:每小时

  • min:每分钟

必需

有效值:后跟 M、WD、H min 的整数。 例如,5min

cardinality

使用分类特征 (cat) 时, cardinality 是一个数组,用于指定每个分类特征的类别(组)数。将其设置为 auto 可推断数据中的基数。当数据集中未使用分类功能时,该auto模式也有效。这是为 参数推荐的设置。

将基数设置为 ignore DeepAR 可强制 不使用分类特征,即使它们存在于数据中。

要执行其他数据验证,可以将此参数显式设置为实际值。例如,如果提供了两个分类特征,其中第一个分类特征具有 2,另一个具有 3 个可能的值,则将它设置为 [2, 3]。

有关如何使用分类功能的更多信息,请参阅 主文档页面上的数据部分DeepAR。

可选

有效值:autoignore、正整数数组、空字符串或

默认值: auto

dropout_rate

训练期间使用的丢弃率。该模型使用 zoneout 正则化。对于每个迭代,不更新隐藏神经元的随机子集。典型值小于 0.2。

可选

有效值:浮点值

默认值:0.1

early_stopping_patience

如果设置此参数,则当在指定数量的 内没有取得进展时,训练将停止epochs。 返回具有最低损失的模型作为最终模型。

可选

有效值:整数

embedding_dimension

每个分类特征学习的嵌入向量的大小(用于所有分类特征的相同值)。

在提供分类分组功能时,DeepAR模型可以学习组级别的时间序列模式。为此,模型学习每个组的大小embedding_dimension为 的嵌入向量,并捕获组中所有时间序列的常见属性。较大的 embedding_dimension 允许模式捕获更复杂的模式。但是,由于增加 embedding_dimension 会增加模型中的参数数量,因此需要更多训练数据来准确学习这些参数。此参数的典型值介于 10-100 之间。

可选

有效值:正整数

调整渲染效果的缩放。

learning_rate

训练中使用的学习率。典型值范围从 1e-4 到 1e-1。

可选

有效值:浮点值

默认值:1e-3

likelihood

模型生成一个概率预测,并可以提供分布的分位数和返回样本。根据您的数据,选择用于不确定性估算的适当可能性(噪声模型)。可以选择以下可能性:

  • gaussian (高斯):用于实际值数据。

  • beta:用于 0 和 1 之间 (含端值) 的实际值目标。

  • negative-binomial (负二项式):用于计数数据 (非负整数)。

  • student-T (T 检验):实际值数据的替代,非常适合突发式数据。

  • deterministic-L1 (确定性 L1):损失函数,不估算不确定性,仅学习单点预测。

可选

有效值:gaussian (高斯)betanegative-binomial (负二项式)student-T (T 检验)deterministic-L1 (确定性 L1). 之一。

默认值: student-T

mini_batch_size

训练期间使用的小型批处理的大小。典型值范围为 32 到 512。

可选

有效值:正整数

默认值:128

num_cells

RNN 的各个隐藏层中使用的单元数。典型值范围为 30 到 100。

可选

有效值:正整数

默认值:40

num_dynamic_feat

数据dynamic_feat中提供的 的数量。将其设置为 auto 可推断数据中的动态特征数量。在数据集中未使用任何动态功能时,auto该模式也有效。这是为 参数推荐的设置。

要DeepAR强制 不使用动态功能(即使它们存在于数据中),请将 num_dynamic_feat 设置为 ignore

要执行其他数据验证,可以将此参数显式设置为实际整数值。例如,如果提供了两个动态功能,则将它设置为 2。

可选

有效值:autoignore、正整数或空字符串

默认值: auto

num_eval_samples

计算测试准确度指标时每个时间序列使用的样本数。此参数对训练或最终模型没有任何影响。具体而言,可以使用不同数量的示例查询模型。此参数仅影响训练后测试通道上报告的准确率分数。值越小,评估速度越快,但评估分数通常更差且更不确定。当使用更高的分位数(例如 0.95)进行评估时,增加评估样本的数量可能很重要。

可选

有效值:整数

默认值:100

num_layers

RNN 中的隐藏层数。典型值范围为 1 到 4。

可选

有效值:正整数

设置对象尾部效果的半径 (单位为米)。

test_quantiles

用于计算测试通道上的分位数损失的分位数。

可选

有效值:浮点数数组

默认值:[0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9]