异常或异常值检测的概念 - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

异常或异常值检测的概念

Amazon QuickSight 使用 “异常” 一词来描述不属于整体分布模式的数据点。异常是一个科学术语,还可以通过许多其他词汇表示,包括异常值、偏差、奇异值、例外值、不规则值、怪异值等。您使用的术语可以取决于所执行的分析类型,取决于使用的数据类型,甚至仅仅取决于团队的偏好。这些异常数据点代表了在某些方面异常的实体,即人物、地点、事物或时间。

人类很容易识别模式并发现与众不同的东西。我们的感官为我们提供了这些信息。如果模式很简单,并且只有少量数据,则可以轻松绘制图形来突出显示数据中的异常值。以下是一些简单的例子:

  • 几个蓝色气球中的一个红色气球

  • 一匹遥遥领先的赛马

  • 一个在课堂上走神的孩子

  • 在线订单数增加但发运减少的一天

  • 一个身体康复的人,而其他人没有

某些数据点表示重要事件,而其他数据点表示随机发生的事件。分析过程根据哪些驱动因素(关键驱动因素)对事件的发生有贡献,来发现值得调查的数据。问题对于数据分析至关重要。为什么会发生这件事? 它与什么有关? 事件只发生一次还是发生了多次? 可以做些什么来鼓励或阻止与此类似的事件?

了解差异存在的方式和原因以及这些差异中是否存在模式,需要进行更多的探究。没有机器学习的帮助,每个人都可能得出不同的结论,因为每个人有不同的经验和信息。因此,每个人可能会做出稍有不同的业务决策。如果需要考虑大量的数据或变量,则所需的分析可能会相当多。

ML 支持的异常检测可识别因果关系和相关性,使您能够制定数据驱动的决策。您仍可以进行控制,定义希望作业如何处理您的数据。您可以指定自己的参数,并选择其他选项,例如在贡献分析中识别关键驱动因素。您也可以使用默认设置。以下部分将引导您完成设置过程,并提供有关可用选项的说明。