Amazon SageMaker 模型控制面板 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker 模型控制面板

Amazon SageMaker 模型控制面板是一个集中式门户,可通过 SageMaker 控制台进行访问,您可以在其中查看、搜索和浏览账户中的所有模型。您可以跟踪部署了哪些模型进行推理,以及这些模型是用于批量转换作业还是托管在端点上。如果您使用 Amazon SageMaker 模型监控器设置监控器,则还可以在模型对实时数据进行实时预测时跟踪其性能。您可以使用控制面板查找违反您为数据质量、模型质量、偏差和可解释性设置的阈值的模型。控制面板全面展示了您的所有监控结果,可帮助您快速识别未配置这些指标的模型。

模型控制面板汇总了来自多个 SageMaker 特征的模型相关信息。除了模型监控器中提供的服务外,您还可以查看模型卡、可视化工作流世系以及跟踪端点性能。您不再需要整理日志、在笔记本中查询或访问其他 Amazon 服务来收集所需的数据。SageMaker 的模型控制面板可提供连贯的用户体验,并与现有服务集成,提供了开箱即用的模型治理解决方案,帮助您确保高质量覆盖所有模型。

先决条件

要使用模型控制面板,您的账户中必须有一个或多个模型。您可以使用 Amazon SageMaker 训练模型,也可以导入您在其他地方训练过的模型。要在 SageMaker 中创建模型,可以使用 CreateModel API。有关更多信息,请参阅 CreateModel。您还可以使用 SageMaker 提供的机器学习环境,例如 Amazon SageMaker Studio,它提供了可为您设置模型训练和部署的项目模板。有关如何开始使用 Studio 的信息,请参阅 Amazon SageMaker Studio

虽然这不是强制性的先决条件,但如果客户使用 SageMaker 模型监控器为部署到端点的模型设置模型监控作业,就可以从控制面板中获得巨大价值。有关如何使用 SageMaker 模型监控器的先决条件和说明,请参阅监控数据和模型质量

模型控制面板元素

模型控制面板视图从每个模型中提取大致细节,以提供您账户中每个模型的综合摘要。如果部署了用于推理的模型,控制面板可帮助您实时跟踪模型和端点的性能。

本页需要强调的重要细节包括:

  • 风险评级:模型卡中用户指定的参数,其值为。模型卡的风险评级是衡量模型预测对业务影响的分类指标。模型用于各种业务应用,每种应用都承担不同程度的风险。例如,错误地检测网络攻击比错误地对电子邮件进行分类对业务的影响要大得多。如果不知道模型风险,可将其设置为未知。有关 Amazon SageMaker 模型卡的信息,请参阅模型卡

  • 模型监控器警报:模型监控器警报是模型控制面板的主要焦点,查看 SageMaker 提供的各种监控器的现有文档是一种很有用的入门方式。有关 SageMaker 模型监控器特征和示例笔记本的深入说明,请参阅监控数据和模型质量

    模型控制面板按以下监控器类型显示模型监控器状态值:

    • 数据质量:将实时数据与训练数据进行比较。如果它们出现分歧,则模型的推理可能不再准确。有关数据质量监控器的更多详细信息,请参阅监控数据质量

    • 模型质量:将模型做出的预测与模型尝试预测的实际 Ground Truth 标签进行比较。有关模型质量监控器的更多详细信息,请参阅监控模型质量

    • 偏差偏移:比较实时数据和训练数据的分布,这也会导致预测不准确。有关偏差偏移监控器的更多详细信息,请参阅监控生产中模型的偏差偏移

    • 特征归因偏移:也称为可解释性偏移。比较训练数据和实时数据中特征的相对排名,这也可能是偏差偏移的结果。有关特征归因偏移监控器的更多详细信息,请参阅监控生产中模型的特征归因偏移

    每个模型监控器状态都是以下值之一:

    • :未计划任何监控器

    • 非活动:监控器已计划,但已停用

    • 正常:监控器已计划并处于活动状态,并且在最近的模型监控器执行中未达到触发警报所需的违规次数

    • 时间和日期:活动的监控器在指定时间和日期发出警报

  • 端点:托管模型以进行实时推理的端点。在模型控制面板中,您可以选择端点列来实时查看端点的 CPU、GPU、磁盘和内存利用率等性能指标,从而帮助跟踪计算实例的性能。

  • 批量转换作业:使用此模型运行的最近一次批量转换作业。此列可帮助您确定模型是否正用于批量推理。

  • 模型详细信息:控制面板中的每个条目都链接到模型详细信息页面,您可以在其中更深入地了解单个模型。您可以访问模型的世系图,该图直观显示了从数据准备到部署的工作流,以及每个步骤的元数据。您还可以创建和查看模型卡,查看警报详细信息和历史记录,评估实时端点的性能,以及访问其他与基础设施相关的详细信息。