配置调试器监视硬件系统资源利用率 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置调试器监视硬件系统资源利用率

要调整调试器系统监视时间间隔,请使用ProfilerConfigAPI 操作来创建参数对象,同时根据您的喜好构建 SageMaker 框架或泛型估计器。

注意

默认情况下,对于所有 SageMaker 培训作业,调试器每 500 毫秒从 Amazon EC2 实例收集硬件系统利用率数据以进行系统监控,而不会在 SageMaker 估计器中指定任何特定于调试器的参数。

调试器将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/.

下面的示例代码演示了如何设置profiler_config参数,系统监视时间间隔为 1000 毫秒。

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis(int) — 指定记录系统度量的监视间隔(以毫秒为单位)。可用值分别为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值为 500 毫秒。

要查看系统监视的进度,请参阅打开 Amazon SageMaker 调试器见解控制面板.