本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 添加 ML 洞察以检测异常值和关键驱动因素


您可以添加用于检测*异常*的 ML 洞察，异常是看似显著的异常值。要开始使用，您需要为自己的洞察创建一个小组件，也称为*自动叙述*。配置选项时，可以在屏幕右侧的**预览**窗格中查看洞察的有限屏幕截图。

在您的洞察小组件中，您最多可以添加五个不是计算字段的维度字段。在字段井中，**类别**的值表示 Amazon Quick Sight 用于拆分指标的维度值。例如，假设您正在分析所有产品类别和产品的收入 SKUs。有 10 个产品类别，每个类别有 10 个产品 SKUs。Amazon Quick Sight 按照 100 个唯一组合对指标进行拆分，并对拆分的每个组合进行异常检测。

以下步骤说明了如何执行此操作，以及如何添加贡献分析以检测导致每个异常的关键驱动因素。您可以稍后添加贡献分析，如 [对关键驱动因素使用贡献分析](anomaly-detection-adding-key-drivers.md) 中所述。

**设置异常值分析，包括主要驱动因素**

1. 打开您的分析，在工具栏中选择**见解**，然后选择**添加**。从列表中，选择 **Anomaly detection (异常检测)** 和 **Select (选择)**。

1. 按照新小部件上的屏幕提示操作，它会告诉您如何为见解选择字段。必须添加至少一个日期、一个度量和一个维度。

1. 在小部件上选择 **Get started (开始)**。此时将显示配置屏幕。

1. 在**计算选项**下，为以下选项选择值。

   1. 对于**要分析的组合**，请选择以下选项之一：

      1. **分层**

         如果要按层次分析字段，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 会按层次分析字段，如下所示。

         ```
         T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
         ```

      1. **精确**

         如果您只想分析“类别”字段井中列出的字段的精确组合，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 将仅按类别字段的列出顺序分析它们的精确组合，如下所示。

         ```
         T-C1-C2-C3-N
         ```

      1. **全部**

         如果您想分析“类别”字段井中的所有字段组合，请选择此选项。例如，如果您选择日期 (T)、度量 (N) 和三个维度类别（C1、C2 和 C3），Quick Sight 会分析所有字段组合，如下所示。

         ```
         T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N
         ```

      如果您只选择日期和度量，Quick Sight 会先按日期分析字段，然后按度量分析字段。

      在**要分析的字段**部分中，您可以看到字段井中用于参考的字段列表。

   1. 在**名称**中，输入不含空格的描述性字母数字名称，或者选择默认值。这为计算提供了名称。

      如果您计划编辑自动显示在小部件上的叙述，则可以使用该名称来识别此小部件的计算。如果您计划编辑自动叙述，并且分析中有其他类似的计算时，可自定义名称。

1. 在**显示选项**部分，选择以下选项以自定义洞察小组件中显示的内容。无论显示什么，您仍然可以探索所有结果。

   1. **要显示的最大异常数** – 要在叙述小组件中显示的异常值数量。

   1. **严重性** – 要在洞察小组件中显示的异常的最低严重性级别。

      *严重性级别* 是一个异常分数范围，其特征是该范围中包含的最低实际异常分数。所有分数较高的异常都包含在范围内。如果将严重性设置为**低**，则洞察会显示排名介于低和非常高之间的所有异常。如果将严重性设置为 **Very high (非常高)**，则见解仅显示具有最高异常分数的异常。

      可以使用以下选项：
      + **非常高** 
      + **高及以上** 
      + **中等及以上** 
      + **低及以上** 

   1. **方向** – 要识别为异常的值在 x 轴或 y 轴上的方向。可从以下选项中进行选择：
      + **高于预期**将较高的值识别为异常。
      + **低于预期**将较低的值识别为异常。
      + **[ALL]** 将识别所有异常值，包括高值和低值（默认设置）。

   1. **增量** – 输入用于识别异常的自定义值。任何高于阈值的数量均视为异常。此处的值会更改分析中洞察的工作方式。在此部分，您可以设置以下内容：
      + **绝对值** – 要使用的实际值。例如，假设这个值是 48。然后，当一个值和预期值之间的差大于 48 时，Amazon Quick Sight 会将值识别为异常。
      + **百分比** – 要使用的百分比阈值。例如，假设这个值是 12.5%。然后，当值与预期值之间的差异大于 12.5% 时，Amazon Quick Sight 会将值识别为异常。

   1. **排序依据** – 为结果选择排序方法。有些方法基于 Amazon Quick Sight 生成的异常分数。对于看起来异常的数据点，Amazon Quick Sight 会给出更高的分数。您可以使用以下任意选项：
      + **加权异常分数** – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。
      + **异常分数** – 分配给此数据点的实际异常分数。
      + **与预期值的加权差** – 异常分数乘以实际值和预期值之差（默认）。
      + **与预期值的差** – 实际值与预期值之间的实际差（即，实际值-预期值）。
      + **实际值** – 未应用公式的实际值。

1. 在**计划选项**部分，您可以设置计划以自动运行洞察的重新计算。仅为已发布的控制面板运行计划。在分析中，您可以根据需要手动运行它。计划的安排包括以下设置。
   + **发生率** – 希望重新计算运行的频率：每小时、每天、每周或每个月。
   + **计划开始时间** – 开始运行此计划的日期和时间。
   + **时区** – 在其中运行计划的时区。要查看列表，请删除当前条目。

1. 在 “**最佳贡献者**” 部分，将 Amazon Quick Sight 设置为在检测到异常值（异常）时分析关键驱动因素。

   例如，Amazon Quick Sight可以显示促成美国家居装修产品销售激增的主要客户。您最多可以从数据集中添加四个维度。这些维度包括您未添加到此洞察小组件的字段井中的维度。

   对于可用于贡献分析的维度列表，请选择**选择字段**。

1. 选择**保存**以确认您的选择。选择 **Cancel (取消)** 退出而不保存。

1. 从洞察小组件中，选择**立即运行**以运行异常检测并查看您的洞察。

异常检测完成所需的时间取决于要分析的唯一数据点的数量。此过程可能需要几分钟时间（对于最小点数），也可能需要数小时。

当它在后台运行时，您可以对分析执行别的操作。对于此洞察，确保等待它完成，然后再更改配置、编辑叙述或打开**探索异常**页面。

洞察小组件需要至少运行一次才能看到结果。如果您认为状态可能已过期，可以刷新页面。洞察可能为以下状态之一。


| 页面上显示 | Status | 
| --- | --- | 
| Run now (立即运行) 按钮 | 该作业尚未开始。 | 
| 关于 Analyzing for anomalies (分析异常) 的消息 | 作业当前正在运行。 | 
| 关于检测到的异常（异常值）的叙述  | 作业已成功运行。该消息显示此小部件的计算上次更新时间。 | 
| 带有感叹号的警报图标（\$1）  | 此图标表示上次运行期间出现错误。如果还显示叙述，您仍可以使用 Explore anomalies (探索异常) 来使用上一次成功运行的数据。 |