在训练作业运行时更新 Debugger 系统监控和框架分析配置 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

在训练作业运行时更新 Debugger 系统监控和框架分析配置

如果您要为当前正在运行的训练作业启用或更新 Debugger 监控和分析配置,请使用以下 SageMaker 估计器扩展方法:

  • 要为正在运行的训练作业启用 Debugger 系统监控并接收 Debugger 性能分析报告,请使用以下命令:

    estimator.enable_default_profiling()

    使用 enable_default_profiling 方法时,Debugger 会启动默认系统监控和 ProfileReport 内置规则,这会在训练作业结束时生成综合分析报告。只有在当前训练作业在运行时没有使用 Debugger 监控和性能分析的情况下,才能调用此方法。

    有关更多信息,请参阅 Amazon SageMaker Python SDK 中的 estimator.enable_default_profiling

  • 要更新系统监控配置,请使用以下命令:

    estimator.update_profiler( system_monitor_interval_millis=500 )

    有关更多信息,请参阅 Amazon SageMaker Python SDK 中的 estimator.update_profiler