Amazon SageMaker 调试功能发行说明 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

Amazon SageMaker 调试功能发行说明

请参阅以下发行说明,了解有关 Amazon SageMaker 调试功能的最新更新。

2023 年 9 月 7 日

新功能

添加了一个新的实用程序模块 sagemaker.interactive_apps.tensorboard.TensorBoardApp,该模块提供了名为 get_app_url() 的函数。get_app_url() 函数生成未签名或预签名的 URL,用于在 SageMaker 或 Amazon EC2 的任何环境中打开 TensorBoard 应用程序。这是为了向 Studio 用户和非 Studio 用户提供统一的体验。对于 Studio 环境,您可以通过按原样运行 get_app_url() 函数来打开 TensorBoard,也可以指定作业名称,以便在 TensorBoard 应用程序打开时开始跟踪。对于非 Studio 环境,您可以通过向实用程序函数提供您的域信息来打开 TensorBoard。有了此功能,无论您在哪里或者以何种方式运行训练代码和启动训练作业,都能够在 Jupyter 笔记本或终端中运行 get_app_url 函数来直接访问 TensorBoard。此功能在 SageMaker Python SDK v2.184.0 及更高版本中可用。有关更多信息,请参阅 如何访问 TensorBoard on SageMaker

2023 年 4 月 4 日

新功能

发布了带有 TensorBoard 的 SageMaker,此功能用于在 SageMaker 上托管 TensorBoard。TensorBoard 可作为应用程序通过 SageMaker 域使用,SageMaker 训练平台支持将 TensorBoard 输出数据收集到 S3,并将其自动加载到 SageMaker 上托管的 TensorBoard 中。借助此功能,您可以运行使用 TensorBoard 摘要编写器在 SageMaker 中设置的训练作业,将 TensorBoard 输出文件保存在 Amazon S3 中,直接从 SageMaker 控制台打开 TensorBoard 应用程序,然后使用在托管式 TensorBoard 接口上实施的 SageMaker Data Manager 插件加载输出文件。您无需手动安装 TensorBoard,也无需在 SageMaker IDE 或本地计算机上进行本地托管。要了解更多信息,请参阅在 Amazon SageMaker 中使用 TensorBoard 调试和分析训练作业

2023 年 3 月 16 日

弃用说明

从 TensorFlow 2.11 和 PyTorch 2.0 开始,SageMaker Debugger 弃用了框架分析功能。您仍然可以在以前版本的框架和 SDK 中使用该功能,如下所示。

  • SageMaker Python SDK <= v2.130.0

  • PyTorch >= v1.6.0 且 < v2.0

  • TensorFlow >= v2.3.1 且 < v2.11

弃用之后,SageMaker Debugger 还停止了对以下三个 ProfilerRules 的框架分析支持。

2023 年 2 月 21 日

其他更改
  • XGBoost 报告选项卡已从 SageMaker Debugger 的探查器控制面板中移除。您仍然可以通过以 Jupyter 笔记本或 HTML 文件格式下载 XGBoost 报告来访问报告。有关更多信息,请参阅 SageMaker Debugger XGBoost 训练报告

  • 从此版本开始,默认情况下不会激活内置的探查器规则。要使用 SageMaker Debugger 探查器规则来检测某些计算问题,您需要在配置 SageMaker 训练作业启动程序时添加这些规则。

2020 年 12 月 1 日

Amazon SageMaker Debugger 在 re:Invent 2020 上推出了深度分析功能。

2019 年 12 月 3 日

Amazon SageMaker Debugger 最初在 re:Invent 2019 上推出。