

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 异常或异常值检测的概念


Amazon Quick Sight 使用*异常*一词来描述不属于整体分布模式的数据点。异常是一个科学术语，还可以通过许多其他词汇表示，包括异常值、偏差、奇异值、例外值、不规则值、怪异值等。您使用的术语可以取决于所执行的分析类型，取决于使用的数据类型，甚至仅仅取决于团队的偏好。这些异常数据点代表了在某些方面异常的实体，即人物、地点、事物或时间。

人类很容易识别模式并发现与众不同的东西。我们的感官为我们提供了这些信息。如果模式很简单，并且只有少量数据，则可以轻松绘制图形来突出显示数据中的异常值。以下是一些简单的例子：
+ 几个蓝色气球中的一个红色气球
+ 一匹遥遥领先的赛马
+ 一个在课堂上走神的孩子
+ 在线订单数增加但发运减少的一天
+ 一个身体康复的人，而其他人没有

某些数据点表示重要事件，而其他数据点表示随机发生的事件。分析过程根据哪些驱动因素（关键驱动因素）对事件的发生有贡献，来发现值得调查的数据。问题对于数据分析至关重要。为什么会发生这件事？ 它与什么有关？ 事件只发生一次还是发生了多次？ 可以做些什么来鼓励或阻止与此类似的事件？ 

了解差异存在的方式和原因以及这些差异中是否存在模式，需要进行更多的探究。没有机器学习的帮助，每个人都可能得出不同的结论，因为每个人有不同的经验和信息。因此，每个人可能会做出稍有不同的业务决策。如果需要考虑大量的数据或变量，则所需的分析可能会相当多。

ML 支持的异常检测可识别因果关系和相关性，使您能够制定数据驱动的决策。您仍可以进行控制，定义希望作业如何处理您的数据。您可以指定自己的参数，并选择其他选项，例如在贡献分析中识别关键驱动因素。您也可以使用默认设置。以下部分将引导您完成设置过程，并提供有关可用选项的说明。