配置调试器监视硬件系统资源利用率 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置调试器监视硬件系统资源利用率

要调整调试器系统监控时间间隔,请使用ProfilerConfigAPI 操作用于在构建SageMaker框架或通用估计器取决于你的偏好。

注意

默认情况下,对于所有SageMaker训练作业时,调试器每 500 毫秒从 Amazon EC2 实例收集硬件系统利用率数据以进行系统监控,而不在中指定任何调试器特定参数SageMaker估算程序。

调试器将系统指标保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为s3://sagemaker-<region>-<12digit_account_id>/<training-job-name>/profiler-output/.

以下示例代码说明了如何设置profiler_config系统监视时间间隔为 1000 毫秒的参数。

from sagemaker.debugger import ProfilerConfig profiler_config=ProfilerConfig( system_monitor_interval_millis=1000 )
  • system_monitor_interval_millis(int) — 指定记录系统指标的监控间隔(以毫秒为单位)。可用值为 100、200、500、1000(1 秒)、5000(5 秒)和 60000(1 分钟)毫秒。默认值是 500 毫秒。

要查看系统监控的进度,请参阅打开 Amazon SageMaker 调试程序见解控制面板.