在运行训练作业时更新 调试程序 系统监控和框架分析配置 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在运行训练作业时更新 调试程序 系统监控和框架分析配置

如果要为当前正在运行的训练作业启用或更新 调试程序 监控和分析配置,请使用以下 SageMaker 评估程序扩展方法:

  • 要为正在运行的训练作业启用 调试程序 系统监控并接收 调试程序 分析报告,请使用以下命令:

    estimator.enable_default_profiling()

    当您使用 enable_default_profiling 方法时,调试程序 会启动默认系统监控以及 ProfileReport 内置规则,该规则会在训练作业结束时生成全面的分析报告。仅当当前训练作业在没有 调试程序 监控和分析的情况下运行时,此方法才能被调用。

    有关更多信息,请参阅 中的 estimator.enable_default_profilingAmazon SageMaker Python SDK

  • 要使用可自定义的配置参数启用 调试程序 内置规则、系统监控和框架分析,请使用以下命令:

    estimator.update_profiler( rules=[ProfilerRule.sagemaker(rule_configs.BuiltInRule())], system_monitor_interval_millis=500, framework_profile_params=FrameworkProfile() )

    有关更多信息,请参阅 中的 estimator.update_profilerAmazon SageMaker Python SDK