查看和编辑警报 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

查看和编辑警报

模型控制面板显示您在 Amazon 中配置的警报 CloudWatch。您可以直接在控制面板中修改警报条件。警报条件取决于两个参数:

  • 要对其发出警报的数据点:在评估期内,有多少次执行失败会引发警报。

  • 评估期:评估警报状态时要考虑的最近监控执行次数。

下图显示了一系列 Model Monitor 执行的示例场景,在该场景中,我们将假设的评估期设置为 3,将要对其发出警报的数据点值设置为 2。每次监控执行后,都会计算评估期 3 内的故障次数。如果失败次数达到或超过要对其发出警报的数据点值 2,则监控器会发出警报并保持警报状态,直到在随后的迭代中,评估期内的故障次数小于 2。在图像中,当监控器发出警报或保持警报状态时,评估窗口为红色,否则为绿色。

请注意,如图中前 2 行所示,即使评估窗口大小未达到评估期 3,但如果故障次数达到或超过要对其发出警报的数据点值 2,则监控器仍会发出警报。

由七个示例监控执行组成的序列。每次监控执行后,评估窗口都会向前滑动另一次执行。

在监控器详细信息页面中,您可以查看警报历史记录,编辑现有警报条件,以及查看作业报告以帮助调试警报故障。有关如何查看监控执行失败的警报历史记录或作业报告的说明,请参阅查看警报历史记录或作业报告。有关如何编辑警报条件的说明,请参阅编辑警报条件

查看警报历史记录或作业报告

要查看执行失败的警报历史记录或作业报告,请完成以下步骤:
  1. 打开SageMaker 控制台

  2. 在左侧面板中选择治理

  3. 选择模型控制面板

  4. 在模型控制面板的模型部分,选择要查看的警报历史记录的模型名称。

  5. 计划名称列中,选择要查看的警报历史记录的监控器名称。

  6. 要查看警报历史记录,请选择警报历史记录选项卡。

  7. (可选)要查看监控执行的作业报告,请完成以下步骤:

    1. 警报历史记录选项卡中,为要调查的警报选择查看执行

    2. 执行历史记录表中,选择要调查的监控执行的查看报告

      报告将显示以下信息:
      • 特征:监控的用户定义的机器学习特征

      • 约束:监控器内的特定检查

      • 违规详细信息:有关违反约束的原因的信息

编辑警报条件

要在模型控制面板中编辑警报,请完成以下步骤:
  1. 打开SageMaker 控制台

  2. 在左侧面板中选择治理

  3. 选择模型控制面板

  4. 在模型控制面板的模型部分,选择要修改的警报的模型名称。

  5. 选中要修改的警报的监控计划旁边的单选框。

  6. 监控计划部分中选择编辑警报

  7. (可选)如果要更改评估期内触发警报的故障次数,请更改要对其发出警报的数据点

  8. (可选)如果要更改评估警报状态时要考虑的最近监控执行次数,请更改评估期