配置 SageMaker 调试器以保存张量 - 亚马逊 SageMaker AI
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

配置 SageMaker 调试器以保存张量

张量是每次训练迭代的向后和向前传递的更新参数的数据集合。 SageMaker 调试器收集输出张量以分析训练作业的状态。 SageMaker 调试器CollectionConfigDebuggerHookConfigAPI 操作提供了将张量分组为集合并将其保存到目标 S3 存储桶的方法。以下主题将介绍如何使用 CollectionConfigDebuggerHookConfig API 操作,并举例说明如何使用 Debugger 钩子保存、访问和可视化输出张量。

在构造 A SageMaker I 估计器时,通过指定参数来激活 SageMaker 调试器。debugger_hook_config以下主题提供的示例说明了如何使用 CollectionConfigDebuggerHookConfig API 操作设置 debugger_hook_config,以从训练作业中提取张量并保存它们。

注意

除非另有说明,否则在正确配置和激活后, SageMaker Debugger 会将输出张量保存在默认 S3 存储桶中。默认 S3 存储桶 URI 的格式为 s3://amzn-s3-demo-bucket-sagemaker-<region>-<12digit_account_id>/<training-job-name>/debug-output/