SageMaker 调试程序 Studio 上的 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

SageMaker 调试程序 Studio 上的

在 Studio 上使用调试程序控制面板分析模型性能和系统瓶颈,同时在 Amazon Elastic Compute Cloud 实例上运行训练作业。使用 调试程序 控制面板,深入了解您的训练作业并改进模型训练性能和准确性。默认情况下, 每 500 毫秒调试程序监控系统指标(CPU、GPU、CPU 和 GPU 内存、网络和数据 I/O)一次,每 500 次迭代对于训练作业,则监控基本输出张量(损失和准确性)。您还可以通过 Studio UI 或使用 进一步自定义调试程序配置参数值并调整保存间隔Amazon SageMaker Python SDK

重要

如果使用现有的 SageMaker Studio 应用程序,您需要重新启动这些应用程序才能使用新功能。有关如何重启和更新 Studio 环境的说明,请参阅更新 Amazon SageMaker Studio


            SageMaker Studio 调试程序 控制面板的示例