在训练Job 运行时更新调试器系统监控和框架分析配置 - 亚马逊 SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在训练Job 运行时更新调试器系统监控和框架分析配置

如果要激活或更新当前正在运行的训练作业的调试器监控配置,请使用以下 esti SageMaker mator 扩展方法:

  • 要激活正在运行的训练作业的调试器系统监控并接收调试器分析报告,请使用以下命令:

    estimator.enable_default_profiling()

    当您使用该enable_default_profiling方法时,Debugger 会启动默认的系统监控和ProfileReport内置规则,这将在训练作业结束时生成全面的分析报告。只有在当前训练作业正在运行且未同时进行调试器监控和性能分析时,才能调用此方法。

    有关更多信息,请参阅亚马逊 SageMaker Python 开发工具包中的 estimator.enable_default _pro filing。

  • 要更新系统监控配置,请使用以下命令:

    estimator.update_profiler( system_monitor_interval_millis=500 )

    有关更多信息,请参阅亚马逊 SageMaker Python 开发工具包中的 e stimator.update_profiler