

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 通过 ML 支持的异常检测功能检测异常值
检测异常值

Amazon Quick Sight 使用久经考验的亚马逊技术，对数百万个指标持续运行 ML 支持的异常检测，以发现数据中隐藏的趋势和异常值。该工具使您能够获得通常埋藏在聚合中，不能通过手动分析扩展得到的深刻洞察。有了 ML 支持的异常检测后，您可以在数据中查找异常值而无需手动分析、自定义开发或机器学习领域的专业知识。

如果Amazon Quick Sight检测到您可以分析异常情况或对数据进行一些预测，它会在您的视觉效果中通知您。

异常检测在 `eu-central-2` 欧洲（苏黎世）区域不可用。

**重要**  
ML 支持的异常检测是一项计算密集型任务。在开始使用它之前，可以通过分析要使用的数据量来了解一下成本。我们提供了基于您每月处理的指标量的阶梯定价模型。

**Topics**
+ [

# 异常或异常值检测的概念
](anomaly-detection-outliers-and-key-drivers.md)
+ [

# 针对异常值分析设置 ML 支持的异常检测
](anomaly-detection-using.md)
+ [

# 使用 ML 支持的异常检测和贡献分析探索异常值和关键驱动因素
](anomaly-exploring.md)

# 异常或异常值检测的概念


Amazon Quick Sight 使用*异常*一词来描述不属于整体分布模式的数据点。异常是一个科学术语，还可以通过许多其他词汇表示，包括异常值、偏差、奇异值、例外值、不规则值、怪异值等。您使用的术语可以取决于所执行的分析类型，取决于使用的数据类型，甚至仅仅取决于团队的偏好。这些异常数据点代表了在某些方面异常的实体，即人物、地点、事物或时间。

人类很容易识别模式并发现与众不同的东西。我们的感官为我们提供了这些信息。如果模式很简单，并且只有少量数据，则可以轻松绘制图形来突出显示数据中的异常值。以下是一些简单的例子：
+ 几个蓝色气球中的一个红色气球
+ 一匹遥遥领先的赛马
+ 一个在课堂上走神的孩子
+ 在线订单数增加但发运减少的一天
+ 一个身体康复的人，而其他人没有

某些数据点表示重要事件，而其他数据点表示随机发生的事件。分析过程根据哪些驱动因素（关键驱动因素）对事件的发生有贡献，来发现值得调查的数据。问题对于数据分析至关重要。为什么会发生这件事？ 它与什么有关？ 事件只发生一次还是发生了多次？ 可以做些什么来鼓励或阻止与此类似的事件？ 

了解差异存在的方式和原因以及这些差异中是否存在模式，需要进行更多的探究。没有机器学习的帮助，每个人都可能得出不同的结论，因为每个人有不同的经验和信息。因此，每个人可能会做出稍有不同的业务决策。如果需要考虑大量的数据或变量，则所需的分析可能会相当多。

ML 支持的异常检测可识别因果关系和相关性，使您能够制定数据驱动的决策。您仍可以进行控制，定义希望作业如何处理您的数据。您可以指定自己的参数，并选择其他选项，例如在贡献分析中识别关键驱动因素。您也可以使用默认设置。以下部分将引导您完成设置过程，并提供有关可用选项的说明。

# 针对异常值分析设置 ML 支持的异常检测


使用以下各节中的步骤开始检测异常值、检测异常并识别导致异常的关键驱动因素。

**Topics**
+ [

# 查看异常和预测通知
](anomaly-detection-adding-from-visuals.md)
+ [

# 添加 ML 洞察以检测异常值和关键驱动因素
](anomaly-detection-adding-anomaly-insights.md)
+ [

# 对关键驱动因素使用贡献分析
](anomaly-detection-adding-key-drivers.md)

# 查看异常和预测通知


Amazon Quick Sight 会在视觉上通知您，它会检测到异常情况、关键驱动因素或预测机会。您可以按照提示设置异常检测或基于该视觉对象中的数据进行预测。

1. 在现有折线图中，在视觉对象小组件的菜单中查找洞察通知。

1. 选择灯泡图标以显示通知。

1. 如果您想了解有关 ML 洞察的更多信息，可以按照屏幕提示添加 ML 洞察。

# 添加 ML 洞察以检测异常值和关键驱动因素


您可以添加用于检测*异常*的 ML 洞察，异常是看似显著的异常值。要开始使用，您需要为自己的洞察创建一个小组件，也称为*自动叙述*。配置选项时，可以在屏幕右侧的**预览**窗格中查看洞察的有限屏幕截图。

在您的洞察小组件中，您最多可以添加五个不是计算字段的维度字段。在字段井中，**类别**的值表示 Amazon Quick Sight 用于拆分指标的维度值。例如，假设您正在分析所有产品类别和产品的收入 SKUs。有 10 个产品类别，每个类别有 10 个产品 SKUs。Amazon Quick Sight 按照 100 个唯一组合对指标进行拆分，并对拆分的每个组合进行异常检测。

以下步骤说明了如何执行此操作，以及如何添加贡献分析以检测导致每个异常的关键驱动因素。您可以稍后添加贡献分析，如 [对关键驱动因素使用贡献分析](anomaly-detection-adding-key-drivers.md) 中所述。

**设置异常值分析，包括主要驱动因素**

1. 打开您的分析，在工具栏中选择**见解**，然后选择**添加**。从列表中，选择 **Anomaly detection (异常检测)** 和 **Select (选择)**。

1. 按照新小部件上的屏幕提示操作，它会告诉您如何为见解选择字段。必须添加至少一个日期、一个度量和一个维度。

1. 在小部件上选择 **Get started (开始)**。此时将显示配置屏幕。

1. 在**计算选项**下，为以下选项选择值。

   1. 对于**要分析的组合**，请选择以下选项之一：

      1. **分层**

         如果要按层次分析字段，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 会按层次分析字段，如下所示。

         ```
         T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
         ```

      1. **精确**

         如果您只想分析“类别”字段井中列出的字段的精确组合，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 将仅按类别字段的列出顺序分析它们的精确组合，如下所示。

         ```
         T-C1-C2-C3-N
         ```

      1. **全部**

         如果您想分析“类别”字段井中的所有字段组合，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 会分析所有字段组合，如下所示。

         ```
         T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N
         ```

      如果您只选择日期和度量，Quick Sight 会先按日期分析字段，然后按度量分析字段。

      在**要分析的字段**部分中，您可以看到字段井中用于参考的字段列表。

   1. 在**名称**中，输入不含空格的描述性字母数字名称，或者选择默认值。这为计算提供了名称。

      如果您计划编辑自动显示在小部件上的叙述，则可以使用该名称来识别此小部件的计算。如果您计划编辑自动叙述，并且分析中有其他类似的计算时，可自定义名称。

1. 在**显示选项**部分，选择以下选项以自定义洞察小组件中显示的内容。无论显示什么，您仍然可以探索所有结果。

   1. **要显示的最大异常数** – 要在叙述小组件中显示的异常值数量。

   1. **严重性** – 要在洞察小组件中显示的异常的最低严重性级别。

      *严重性级别* 是一个异常分数范围，其特征是该范围中包含的最低实际异常分数。所有分数较高的异常都包含在范围内。如果将严重性设置为**低**，则洞察会显示排名介于低和非常高之间的所有异常。如果将严重性设置为 **Very high (非常高)**，则见解仅显示具有最高异常分数的异常。

      可以使用以下选项：
      + **非常高** 
      + **高及以上** 
      + **中等及以上** 
      + **低及以上** 

   1. **方向** – 要识别为异常的值在 x 轴或 y 轴上的方向。可从以下选项中进行选择：
      + **高于预期**将较高的值识别为异常。
      + **低于预期**将较低的值识别为异常。
      + **[ALL]** 将识别所有异常值，包括高值和低值（默认设置）。

   1. **增量** – 输入用于识别异常的自定义值。任何高于阈值的数量均视为异常。此处的值会更改分析中洞察的工作方式。在此部分，您可以设置以下内容：
      + **绝对值** – 要使用的实际值。例如，假设这个值是 48。然后，当一个值和预期值之间的差大于 48 时，Amazon Quick Sight 会将值识别为异常。
      + **百分比** – 要使用的百分比阈值。例如，假设这个值是 12.5%。然后，当值与预期值之间的差异大于 12.5% 时，Amazon Quick Sight 会将值识别为异常。

   1. **排序依据** – 为结果选择排序方法。有些方法基于 Amazon Quick Sight 生成的异常分数。对于看起来异常的数据点，Amazon Quick Sight 会给出更高的分数。您可以使用以下任意选项：
      + **加权异常分数** – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。
      + **异常分数** – 分配给此数据点的实际异常分数。
      + **与预期值的加权差** – 异常分数乘以实际值和预期值之差（默认）。
      + **与预期值的差** – 实际值与预期值之间的实际差（即，实际值-预期值）。
      + **实际值** – 未应用公式的实际值。

1. 在**计划选项**部分，您可以设置计划以自动运行洞察的重新计算。仅为已发布的控制面板运行计划。在分析中，您可以根据需要手动运行它。计划的安排包括以下设置。
   + **发生率** – 希望重新计算运行的频率：每小时、每天、每周或每个月。
   + **计划开始时间** – 开始运行此计划的日期和时间。
   + **时区** – 在其中运行计划的时区。要查看列表，请删除当前条目。

1. 在 “**最佳贡献者**” 部分，将 Amazon Quick Sight 设置为在检测到异常值（异常）时分析关键驱动因素。

   例如，Amazon Quick Sight可以显示促成美国家居装修产品销售激增的主要客户。您最多可以从数据集中添加四个维度。这些维度包括您未添加到此洞察小组件的字段井中的维度。

   对于可用于贡献分析的维度列表，请选择**选择字段**。

1. 选择**保存**以确认您的选择。选择 **Cancel (取消)** 退出而不保存。

1. 从洞察小组件中，选择**立即运行**以运行异常检测并查看您的洞察。

异常检测完成所需的时间取决于要分析的唯一数据点的数量。此过程可能需要几分钟时间（对于最小点数），也可能需要数小时。

当它在后台运行时，您可以对分析执行别的操作。对于此洞察，确保等待它完成，然后再更改配置、编辑叙述或打开**探索异常**页面。

洞察小组件需要至少运行一次才能看到结果。如果您认为状态可能已过期，可以刷新页面。洞察可能为以下状态之一。


| 页面上显示 | Status | 
| --- | --- | 
| Run now (立即运行) 按钮 | 该作业尚未开始。 | 
| 关于 Analyzing for anomalies (分析异常) 的消息 | 作业当前正在运行。 | 
| 关于检测到的异常（异常值）的叙述  | 作业已成功运行。该消息显示此小部件的计算上次更新时间。 | 
| 带有感叹号的警报图标（\$1）  | 此图标表示上次运行期间出现错误。如果还显示叙述，您仍可以使用 Explore anomalies (探索异常) 来使用上一次成功运行的数据。 | 

# 对关键驱动因素使用贡献分析


Amazon Quick Sight 可以识别导致两个时间点之间度量（指标）异常值的维度（类别）。导致异常值的关键驱动因素可以帮助您回答这个问题：是什么原因导致了这种异常？ 

如果您已经在不使用贡献分析的情况下使用异常检测，则可以启用现有的 ML 洞察来查找关键驱动因素。使用以下步骤添加贡献分析并识别异常值背后的关键驱动因素。您的异常检测洞察需要包括一个时间字段和至少一个聚合指标（SUM、AVERAGE 或 COUNT）。如果您愿意，可以包含多个类别（维度字段），但也可以在不指定任何类别或维度字段的情况下运行贡献分析。

您还可以使用此过程更改或删除作为异常检测关键驱动因素的字段。

**添加贡献分析以识别关键驱动因素**

1. 打开您的分析并找到用于异常检测的现有 ML 洞察。选择洞察小组件以将其突出显示。

1. 从视觉对象的菜单中选择**菜单选项**（**…**）。

1. 选择**配置异常**以编辑设置。

1. **贡献分析（可选）**设置允许 Amazon Quick Sight 在检测到异常值（异常）时分析关键驱动因素。例如，Amazon Quick Sight可以向您显示促成美国家居装修产品销售激增的主要客户。您可以从数据集中添加最多四个维度，包括未添加到此见解小部件的字段井中的维度。

   要查看可用于贡献分析的维度列表，请选择 **Select fields (选择字段)**。

   如果要更改用作关键驱动因素的字段，请更改此列表中启用的字段。如果您全部禁用，Quick Sight 将不会在此洞察中执行任何贡献分析。

1. 要保存更改，请滚动到配置选项底部，然后选择**保存**。要退出而不保存，请选择**取消**。要完全移除这些设置，请选择**删除**。

# 使用 ML 支持的异常检测和贡献分析探索异常值和关键驱动因素
探索异常值和关键驱动因素

您可以通过交互方式探索分析中的异常（也称为异常值）以及贡献因素（关键驱动因素）。可在 ML 支持的异常检测运行后探索该分析。您在此屏幕中所做的更改，在返回分析时不保存。

首先，在洞察中选择**探索异常**。以下屏幕截图显示了首次打开异常屏幕时显示的画面。在此示例中，设置了贡献者分析，并显示了两个关键驱动因素。

![\[显示了贡献者的异常分析。\]](http://docs.amazonaws.cn/quick/latest/userguide/images/anomaly-exploration-v2.png)


屏幕的各个部分从左上到右下包括以下内容：
+ **贡献者**显示关键驱动因素。要查看此部分，您需要在异常配置中设置贡献者。
+ **控件**包含异常探索的设置。
+ **异常的数量**显示一段时间内检测到的异常值。您可以隐藏或显示此图表部分。
+ 您的类别或维度字段的**字段名称**用作显示每个类别或维度异常的图表的标题。

以下部分提供探索异常的各个方面的详细信息。

**Topics**
+ [

# 探索贡献者（关键驱动因素）
](exploring-anomalies-key-drivers.md)
+ [

# 异常检测的设置控件
](exploring-anomalies-controls.md)
+ [

# 按日期显示和隐藏异常
](exploring-anomalies-by-date.md)
+ [

# 按类别或维度探索异常
](exploring-anomalies-per-category-or-dimension.md)

# 探索贡献者（关键驱动因素）


如果您的异常洞察设置为检测关键驱动因素，Quick Sight 会运行贡献分析以确定哪些类别（维度）正在影响异常值。**贡献者**部分显示在左侧。

**贡献者**包含以下部分：
+ **叙述** – 左上角有一个摘要，描述了指标的任何变化。
+ **排名靠前的贡献者配置** – 选择**配置**来更改要在此部分中使用的贡献者和日期范围。
+ **排序依据** – 设置应用于下面显示的结果的排序。可从以下选项中进行选择：
  + **Absolute difference (绝对差异)** 
  + **Contribution percentage (贡献百分比)**（默认） 
  + **Deviation from expected (与预期的偏差)** 
  + **Percentage difference (差额百分比)** 
+ **排名靠前的贡献者的结果** – 显示在右侧时间轴上选择的时间点的最高贡献者分析的结果。

  贡献分析可识别某个异常的最多四个主要的贡献因素或关键驱动因素。例如，Amazon Quick Sight 可以向您显示促成美国健康产品销售激增的主要客户。当您配置异常时，只有选择在贡献分析中包括字段时才会显示此面板。

  如果此面板未显示而您希望显示，则可以开启它。为此，请转到分析，从洞察的菜单中选择异常配置，然后最多选择四个字段来分析贡献。如果您在排除贡献驱动因素的工作表控件中进行更改，则**贡献**面板将关闭。

# 异常检测的设置控件


您可以在屏幕的**控件**部分找到异常检测的设置。您可以通过单击**控件**一词打开和关闭此部分。

其中包括以下设置：
+ **控件** – 当前设置显示在工作区的顶部。您可以通过选择右侧的双箭头图标展开此部分。以下设置可用于探索由 ML 支持的异常检测生成的异常值：
  + **严重性** – 设置探测器对检测到的异常（异常值）的敏感程度。在将阈值设置为**低及以上**时，将会看到较多的异常；在将阈值设置为**高及以上**时，将会看到较少的异常。这种灵敏度是根据 RCF 算法生成的异常分数的标准偏差确定的。默认设置为**中等及以上**。
  + **方向** – 要识别为异常的值在 x 轴或 y 轴上的方向。默认值为 [ALL]。您可以选择以下选项：
    + 设置为**高于预期**，以将较高的值识别为异常。
    + 设置为**低于预期**，以将较低的值识别为异常。
    + 设置为 **[ALL]**，以识别所有异常值，包括高值和低值。
  + **最小差值 – 绝对值** – 输入一个自定义值，用作识别异常的绝对阈值。任何高于此值的数量均视为异常。
  + **最小差值 – 百分比** – 输入一个自定义值，用作识别异常的百分比阈值。任何高于此值的数量均视为异常。
  + **排序依据** – 选择要用于对异常进行排序的方法。它们在屏幕上按首选顺序列出。查看以下列表，了解每种方法的描述。
    + **加权异常分数** – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。
    + **异常分数** – 分配给此数据点的实际异常分数。
    + **与预期值的加权差** –（默认）异常分数乘以实际值和预期值之差。
    + **与预期值的差** – 实际值与预期值之间的实际差（实际值-预期值）。
    + **实际值** – 未应用公式的实际值。
  + **类别** – 一个或多个设置可以出现在其他设置的末尾。对于您添加到类别字段井的每个类别字段，都有一个对应的设置。您可以使用类别设置限制屏幕中显示的数据。

# 按日期显示和隐藏异常


**异常的数量**图表显示一段时间内检测到的异常值。如果您没有看到此图表，则可以通过选择**按日期显示异常**来显示此图表。

此图表显示了时间序列中最新数据点的异常（异常值）。展开后，它会显示以下组件：
+ **异常** – 屏幕中间显示时间序列中最新数据点的异常。显示一个或多个图形，其中一个图表显示指标随时间的变化。要使用此图形，请选择时间轴上的一个点。当前选择的时间点在图形中突出显示，并包括一个菜单，提供对当前指标的贡献进行分析的选项。您也可以不选择特定点，而是将光标拖到时间轴上，显示该时间点的指标值。
+ **按日期显示异常** – 如果选择**按日期显示异常**，则另一个图形将显示每个时间点有多少显著异常。可以在此图表中查看每个条的上下文菜单的详细信息。
+ **时间轴调整** – 每个图形在日期下都有一个时间轴调整工具，您可以使用该工具压缩、展开或选择要查看的时间段。

# 按类别或维度探索异常


**探索异常**屏幕的主要部分锁定在屏幕的右下角。无论屏幕上有多少其他部分处于打开状态，它都会一直留在此处。如果存在多个异常，则可以向外滚动以突出显示。该图表按颜色范围显示异常，并显示它们在一段时间内的发生位置。

![\[探索异常屏幕。\]](http://docs.amazonaws.cn/quick/latest/userguide/images/anomaly-exploration-1.png)


每个类别或维度都有一个单独的图表，该图表使用字段名称作为图表标题。每个图表都包含以下组件：
+ **配置警报** – 如果您正在从控制面板中探索异常，请选择此按钮订阅警报和贡献分析（如果已配置）。您可以为严重性级别（中、高，等等）设置警报。您可以获得 **Higher than expected (高于预期)**、**Lower than expected (低于预期)** 或“ALL (全部)”的前五个警报。控制面板读取器可以为自己配置警报。如果您已从分析中打开**探索异常**页面，则该页面不会显示此按钮。
**注意**  
配置警报的功能仅在已发布的控制面板中可用。
+ **状态** – 在**异常**标头下方，状态标签显示有关上次运行的信息。例如，您可能会看到“2018 年 11 月 17 日的收入异常”。此标签告诉您有多少指标被处理，在多久前处理的。您可以选择该链接来了解详细信息，例如忽略了多少指标。