配置 SageMaker 调试器以保存张量

张量是每次训练迭代的向后和向前传递的更新参数的数据集合。 SageMaker 调试器收集输出张量以分析训练作业的状态。 SageMaker 调试器CollectionConfig和 DebuggerHookConfigAPI 操作提供了将张量分组为集合并将其保存到目标 S3 存储桶的方法。以下主题将介绍如何使用 CollectionConfig 和 DebuggerHookConfig API 操作，并举例说明如何使用 Debugger 钩子保存、访问和可视化输出张量。

在构造 A SageMaker I 估计器时，通过指定参数来激活 SageMaker 调试器。debugger_hook_config以下主题提供的示例说明了如何使用 CollectionConfig 和 DebuggerHookConfig API 操作设置 debugger_hook_config，以从训练作业中提取张量并保存它们。

注意

除非另有说明，否则在正确配置和激活后， SageMaker Debugger 会将输出张量保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为 s3://amzn-s3-demo-bucket-sagemaker-<region>-<12digit_account_id>/<training-job-name>/debug-output/。

主题

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

使用 SageMaker Python SDK 使用调试器启动训练作业

配置张量集合