配置设置以对系统资源利用率进行基本分析 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置设置以对系统资源利用率进行基本分析

要调整收集利用率指标的时间间隔,请使用 ProfilerConfig API 操作创建参数对象,同时根据自己的喜好构建 SageMaker 框架或通用估算器。

注意

默认情况下,对于所有 SageMaker 训练作业,调试器每 500 毫秒从 Amazon EC2 实例收集资源利用率指标进行系统监控,而估算器中不指定任何调试器特定的参数。 SageMaker

Debugger 将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为 s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/

以下示例代码演示了如何设置系统监控时间间隔为 1000 毫秒的 profiler_config 参数。

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis(整数)– 指定记录系统指标的监控间隔(以毫秒为单位)。可用值为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值为 500 毫秒。

要查看系统监控的进度,请参阅打开 Amazon SageMaker 调试器见解控制面板