添加 ML 洞察以检测异常值和关键驱动因素 - Amazon QuickSight
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

添加 ML 洞察以检测异常值和关键驱动因素

您可以添加用于检测异常的 ML 洞察,异常是看似显著的异常值。要开始使用,您需要为自己的洞察创建一个小组件,也称为自动叙述。配置选项时,可以在屏幕右侧的预览窗格中查看洞察的有限屏幕截图。

在您的洞察小组件中,您最多可以添加五个不是计算字段的维度字段。在 wells 字段中,类别的值表示亚马逊 QuickSight 用于拆分指标的维度值。例如,假设您正在分析所有产品类别和产品 SKU 的收入。有 10 个产品类别,每个类别有 10 个产品 SKU。Amazon 按照 100 个唯一组合对指标进行 QuickSight 拆分,并对拆分的每个组合进行异常检测。

以下步骤说明了如何执行此操作,以及如何添加贡献分析以检测导致每个异常的关键驱动因素。您可以稍后添加贡献分析,如 对关键驱动因素使用贡献分析 中所述。

设置异常值分析,包括主要驱动因素
  1. 打开您的分析,然后在工具栏中选择 Insights,然后选择 “添加”。从列表中,选择 Anomaly detection (异常检测)Select (选择)

  2. 按照新小部件上的屏幕提示操作,它会告诉您如何为见解选择字段。必须添加至少一个日期、一个度量和一个维度。

  3. 在小部件上选择 Get started (开始)。此时将显示配置屏幕。

  4. 计算选项下,为以下选项选择值。

    1. 对于要分析的组合,请选择以下选项之一:

      1. 分层

        如果要按层次分析字段,请选择此选项。例如,如果您选择日期 (T)、度量 (N) 和三个维度类别(C1、C2 和 C3),则按层次 QuickSight 分析字段,如下所示。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N
      2. 精确

        如果您只想分析“类别”字段井中列出的字段的精确组合,请选择此选项。例如,如果您选择日期 (T)、度量 (N) 和三个维度类别(C1、C2 和 C3),则仅按类别字段的列出顺序 QuickSight 分析它们的精确组合,如下所示。

        T-C1-C2-C3-N
      3. 全部

        如果您想分析“类别”字段井中的所有字段组合,请选择此选项。例如,如果您选择日期 (T)、度量 (N) 和三个维度类别(C1、C2 和 C3),则会 QuickSight 分析字段的所有组合,如下所示。

        T-N, T-C1-N, T-C1-C2-N, T-C1-C2-C3-N, T-C1-C3-N, T-C2-N, T-C2-C3-N, T-C3-N

      如果您只选择日期和度量,则先按日期 QuickSight 分析字段,然后按度量分析字段。

      要分析的字段部分中,您可以看到字段井中用于参考的字段列表。

    2. 名称中,输入不含空格的描述性字母数字名称,或者选择默认值。这为计算提供了名称。

      如果您计划编辑自动显示在小部件上的叙述,则可以使用该名称来识别此小部件的计算。如果您计划编辑自动叙述,并且分析中有其他类似的计算时,可自定义名称。

  5. 显示选项部分,选择以下选项以自定义洞察小组件中显示的内容。无论显示什么,您仍然可以探索所有结果。

    1. 要显示的最大异常数 – 要在叙述小组件中显示的异常值数量。

    2. 严重性 – 要在洞察小组件中显示的异常的最低严重性级别。

      严重性级别 是一个异常分数范围,其特征是该范围中包含的最低实际异常分数。所有分数较高的异常都包含在范围内。如果将严重性设置为,则洞察会显示排名介于低和非常高之间的所有异常。如果将严重性设置为 Very high (非常高),则见解仅显示具有最高异常分数的异常。

      可以使用以下选项:

      • 非常高

      • 高及以上

      • 中等及以上

      • 低及以上

    3. 方向 – 要识别为异常的值在 x 轴或 y 轴上的方向。可从以下选项中进行选择:

      • 高于预期将较高的值识别为异常。

      • 低于预期将较低的值识别为异常。

      • [ALL] 将识别所有异常值,包括高值和低值(默认设置)。

    4. 增量 – 输入用于识别异常的自定义值。任何高于阈值的数量均视为异常。此处的值会更改分析中洞察的工作方式。在此部分,您可以设置以下内容:

      • 绝对值 – 要使用的实际值。例如,假设这个值是 48。 QuickSight 然后,当值和预期值之间的差大于 48 时,Amazon 会将值识别为异常。

      • 百分比 – 要使用的百分比阈值。例如,假设这个值是 12.5%。 QuickSight 然后,当值与预期值之间的差异大于 12.5% 时,Amazon 会将值识别为异常。

    5. 排序依据 – 为结果选择排序方法。有些方法基于 Amazon QuickSight 生成的异常分数。对于看起来异常的数据点,Amazon 会 QuickSight 给出更高的分数。您可以使用以下任意选项:

      • 加权异常分数 – 异常分数乘以实际值和预期值之差的绝对值的对数。此分数始终是正数。

      • 异常分数 – 分配给此数据点的实际异常分数。

      • 与预期值的加权差 – 异常分数乘以实际值和预期值之差(默认)。

      • 与预期值的差 – 实际值与预期值之间的实际差(即,实际值-预期值)。

      • 实际值 – 未应用公式的实际值。

  6. 计划选项部分,您可以设置计划以自动运行洞察的重新计算。仅为已发布的控制面板运行计划。在分析中,您可以根据需要手动运行它。计划的安排包括以下设置。

    • 发生率 – 希望重新计算运行的频率:每小时、每天、每周或每个月。

    • 计划开始时间 – 开始运行此计划的日期和时间。

    • 时区 – 在其中运行计划的时区。要查看列表,请删除当前条目。

  7. 在 “贡献率最高的贡献者” 部分,将 Amazon 设置为在检测 QuickSight 到异常值(异常)时分析关键驱动因素。

    例如,Amazon QuickSight 可以显示促成美国家居装修产品销售激增的主要客户。您最多可以从数据集中添加四个维度。这些维度包括您未添加到此洞察小组件的字段井中的维度。

    对于可用于贡献分析的维度列表,请选择选择字段

  8. 选择保存以确认您的选择。选择 Cancel (取消) 退出而不保存。

  9. 从洞察小组件中,选择立即运行以运行异常检测并查看您的洞察。

异常检测完成所需的时间取决于要分析的唯一数据点的数量。此过程可能需要几分钟时间(对于最小点数),也可能需要数小时。

当它在后台运行时,您可以对分析执行别的操作。对于此洞察,确保等待它完成,然后再更改配置、编辑叙述或打开探索异常页面。

洞察小组件需要至少运行一次才能看到结果。如果您认为状态可能已过期,可以刷新页面。洞察可能为以下状态之一。

页面上显示 Status
Run now (立即运行) 按钮 该作业尚未开始。
关于 Analyzing for anomalies (分析异常) 的消息 作业当前正在运行。
关于检测到的异常(异常值)的叙述 作业已成功运行。该消息显示此小部件的计算上次更新时间。
带有感叹号的警报图标(! 此图标表示上次运行期间出现错误。如果还显示叙述,您仍可以使用 Explore anomalies (探索异常) 来使用上一次成功运行的数据。