亚马逊SageMakerDebugger (调试程序) - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊SageMakerDebugger (调试程序)

使用 Amazon 实时调试、监控和分析培训作业、检测非融合条件、通过消除瓶颈优化资源利用率、缩短培训时间并降低机器学习模型的成本SageMaker调试程序。

亚马逊SageMaker调试程序功能

机器学习 (ML) 培训作业可能存在诸如系统瓶颈、过度拟合、饱和激活函数和渐变消失等问题,这些问题可能会影响模型性能。

SageMaker调试器配置和调试训练作业,以帮助解决此类问题并提高机器学习模型的计算资源利用率和性能。调试器提供了一些工具,用于在发现训练异常情况时发送警报,对问题采取措施,并通过可视化收集的指标和张量来确定问题的根本原因。

SageMaker调试器支持 Apache MxNet,TensorFlow、PyTorch和 xgBoost。有关可用框架和版本的更多信息,请参阅支持的框架和算法.


                Amazon 的概述SageMaker调试程序工作正常。

高级调试程序工作流程序如下:

  1. 配置SageMaker使用调试器进行培训。

  2. 开始培训工作并实时监控培训问题。

  3. 获取警报并对培训问题迅速采取行动。

  4. 接收培训报告、解决问题的建议以及对培训工作的见解。

  5. 探索对培训问题和瓶颈的深入分析。

  6. 考虑调试器提供的建议修复问题,然后重复步骤 1-5,直到优化模型并达到目标准度。

这些区域有:SageMaker调试器开发人员指南将引导您完成以下主题。