在 Amazon 上使用机器学习见解的数据集要求 QuickSight - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在 Amazon 上使用机器学习见解的数据集要求 QuickSight

要开始使用 Amazon 的机器学习功能 QuickSight,您需要连接或导入数据。您可以使用现有的 Amazon QuickSight 数据集或创建新数据集。您可以直接查询与 SQL 兼容的源,或将数据摄取到 SPICE 中。

数据必须具有以下属性:

  • 至少一个指标(例如,销售额、订单数、发货单位数、注册量等)。

  • 至少一个类别维度(例如,产品类别、通道、分段、行业等)。将忽略具有 NULL 值的类别。

  • 异常检测至少需要 15 个数据点才能进行训练。例如,如果您的数据粒度是每日,则需要至少 15 天的数据。如果粒度是每月,您至少需要 15 个月的数据。

  • 数据越多,预测效果越好。确保您的数据集具有足够的历史数据,以实现最佳结果。例如,如果您的数据粒度是每日,则需要至少 38 天的数据。如果粒度是每月,您至少需要 43 个月的数据。下面是每种时间粒度的要求:

    • 年:32 个数据点

    • 季度:35 个数据点

    • 月:43 个数据点

    • 周:35 个数据点

    • 日:38 个数据点

    • 小时:39 个数据点

    • 分钟:46 个数据点

    • 秒:46 个数据点

  • 如果您要分析异常或预测,则还需要至少一个日期维度。

如果您没有数据集来开始,可以下载此示例数据集:ML Insights 示例数据集 VI。在数据集就绪后,通过该数据集创建新分析。