进行时间序列预测 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

进行时间序列预测

要进行时间序列预测,需要选择一个目标列。目标列包含要预测的数据。例如,您的目标列可能包含已售出商品数量的数据。在您选择目标列后,Amazon SageMaker Canvas 会选择一种模型类型。 SageMaker Canvas 使用时间序列数据自动选择可用于预测数据的时间序列模型。构建模型后,您可以评估模型性能并使用该模型对新数据进行预测。

使用以下过程进行时间序列预测。

要进行时间序列预测,请执行以下操作。

  1. 导入数据。

  2. 在数据集中选择目标列。

  3. SageMaker Canvas 会自动选择时间序列预测作为模型类型。选择设置配置以确认您正在执行时间序列预测。

  4. 指定以下字段:

    • 项目 ID 列 - 包含数据集中每个项目的唯一标识符的列。例如,一个 SKU 编号可唯一标识一个项目。

    • 可选:分组列 - 按列中的值对时间序列预测进行分组。例如,您可以按商店对商品预测进行分组。

    • 时间戳列 - 包含数据集中时间戳的列。有关此列支持的datetime格式的列表,请参阅Amazon C SageMaker anvas 中的时间序列预测

    • Future 时间戳 — 表示未来预测时间的时间戳。 SageMaker Canvas 预测直到时间戳指定的时间点之前的值。

    • 可选:节假日时间表 - 激活节假日时间表以使用某个国家/地区的节假日时间表。使用该时间表可以使您对节假日数据的预测更加准确。

缺失值有以下几种类型:

  • 缺失未来值

  • 缺失值

缺失未来值是指目标列中缺失的值。 SageMaker Canvas 使用目标列中的值来预测未来的值。如果目标列中有缺失值,预测的准确性可能会降低。我们强烈建议更新数据集。

缺失值是指目标列以外的任何列中缺失的值。对于不在目标列中的缺失值,注意以下方面很有帮助:

  • 它们通常不会像缺失未来值那样降低预测的准确性。

  • SageMaker Canvas 会自动估算缺失值。

您可以通过查看预测值与实际值的接近程度来评估模型。您也可以使用列影响指标来确定该列对模型预测的影响的方向和程度。例如,在下图中,节假日对需求预测的正面影响最大。价格对需求的负面影响最大。

构建模型后,您可以进行以下类型的预测:

  • 单个项目 — 对数据集中的单个项目进行预测,并绘制 C SageMaker anvas 预测的值的折线图。例如,您可以查看某个商品的销售额随时间的变化情况。

  • 所有项目 – 对数据集中的所有项目进行预测。

  • 假设情景 – 查看数据集中的数值变化会如何影响单个项目的总体预测。

下图显示了单个项目预测的假设情景。在假设情景中,您可以更改随时间变化的值。您可以看到更改值对预测的影响。

蓝色实线连接的点是模型预测的值。虚线连接的点显示了假设情景。