本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
配置调试器以监视资源利用率
要调整调试器系统监控时间间隔,请使用ProfilerConfig
API 操作创建参数对象,同时根据您的偏好构建 SageMaker 框架或通用估计器。
注意
默认情况下,对于所有 SageMaker 训练任务,Debugger 每 500 毫秒从 Amazon EC2 实例收集资源利用率指标以进行系统监控,而无需在 SageMaker 估算器中指定任何特定于调试器的参数。
调试器将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/
。
以下代码示例展示如何将系统监控时间间隔profiler_config
为 1000 毫秒。
from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=
1000
)
-
system_monitor_interval_millis
(int) — 以毫秒为单位指定监控间隔,以记录系统指标。可用值为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值为 500 毫秒。
要查看系统监控的进度,请参见打开 “亚马逊调 SageMaker 试器见解” 控制面板。