配置设置以对系统资源利用率进行基本分析 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

配置设置以对系统资源利用率进行基本分析

要调整收集利用率指标的时间间隔,请使用 ProfilerConfig API 操作,在构造 SageMaker 框架或通用估计器时,根据您的偏好创建参数对象。

注意

默认情况下,对于所有 SageMaker 训练作业,Debugger 每 500 毫秒从 Amazon EC2 实例收集资源利用率数据以进行系统监控,无需在 SageMaker 估算器中指定任何 Debugger 特定的参数。

Debugger 将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为 s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/

以下示例代码演示了如何设置系统监控时间间隔为 1000 毫秒的 profiler_config 参数。

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis(整数)– 指定记录系统指标的监控间隔(以毫秒为单位)。可用值为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值为 500 毫秒。

要查看系统监控的进度,请参阅打开 Amazon SageMaker Debugger Insights 控制面板