监控超参数优化作业的进度 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控超参数优化作业的进度

要监控所启动超参数优化作业和训练作业的进度,请使用 Amazon SageMaker 控制台。

查看超参数优化作业的状态

查看超参数优化作业的状态

  1. 通过以下网址打开 Amazon SageMaker 控制台:https://console.amazonaws.cn/sagemaker/

  2. 选择 Hyperparameter tuning jobs (超参数优化作业)

  3. 在超参数优化作业列表中,检查您启动的超参数优化作业的状态。优化作业可以处于:

    • Completed — 超参数优化作业成功完成。

    • InProgress — 超参数优化作业正在进行。一个或多个训练作业仍在运行。

    • Failed — 超参数优化作业失败。

    • Stopped — 超参数优化作业在完成之前被手动停止。超参数优化作业启动的所有训练作业已停止。

    • Stopping — 超参数优化作业正在停止。

查看训练作业的状态

查看超参数优化作业启动的训练作业的状态

  1. 在超参数优化作业列表中,选择您启动的作业。

  2. 选择 Training jobs (训练作业)

  3. 查看各个训练作业的状态。要查看有关作业的详细信息,请在训练作业列表中选择该作业。要查看超级参数优化作业启动的所有训练作业的状态摘要,请查看 Training job status counter (训练作业状态计数器)

    训练作业的状态可以为:

    • Completed — 训练作业已成功完成。

    • InProgress — 训练作业正在进行中。

    • Stopped—训练作业在完成之前已手动停止。

    • Failed (Retriable) — 训练作业失败,但可以重试。只有在训练作业由于出现内部服务错误而失败时,才能重试该训练作业。

    • Failed (Non-retriable) — 训练作业失败,并且无法重试。在出现客户端错误时,无法重试失败的训练作业。

查看最佳训练作业

超参数优化作业使用各个训练作业返回的目标指标来评估训练作业。在超参数优化作业进行中时,最佳训练作业是迄今为止返回了最佳目标指标的作业。超参数优化作业完成后,最佳训练作业是返回了最佳目标指标的作业。

要查看最佳训练作业,请选择 Best training job (最佳训练作业)

要将最佳训练作业部署为可在终端节点上托管SageMaker的模型,请选择 Create model (创建模型)。

下一步

清除