监控超参数优化作业的进度 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控超参数优化作业的进度

要监控超参数优化作业及其启动的训练作业的进度,请使用 Amazon SageMaker 控制台。

查看超参数优化作业的状态

查看超参数优化作业的状态

  1. 打开位于 https://console.aws.amazon.com/sagemaker/ 的 Amazon SageMaker 控制台。

  2. 选择 Hyperparameter tuning jobs (超参数优化作业)

  3. 在超参数优化作业列表中,检查您启动的超参数优化作业的状态。优化作业可以处于:

    • Completed-超参数优化作业成功完成。

    • InProgress-超参数优化作业正在进行。一个或多个训练作业仍在运行。

    • Failed-超参数优化作业失败。

    • Stopped-超参数优化作业在完成之前被手动停止。超参数优化作业启动的所有训练作业已停止。

    • Stopping-超参数优化作业正在停止。

查看训练作业的状态

查看超参数优化作业启动的训练作业的状态

  1. 在超参数优化作业列表中,选择您启动的作业。

  2. 选择 Training jobs (训练作业)

  3. 查看各个训练作业的状态。要查看有关作业的详细信息,请在训练作业列表中选择该作业。要查看超参数优化作业启动的所有训练作业的状态摘要,请查看 Training job status counter (训练作业状态计数器)

    训练作业的状态可以为:

    • Completed— 培训作业已成功完成。

    • InProgress— 训练作业正在进行中。

    • Stopped-训练作业在完成之前被手动停止。

    • Failed (Retryable)-训练作业失败,但可以重试。只有在训练作业由于出现内部服务错误而失败时,才能重试该训练作业。

    • Failed (Non-retryable)-训练作业失败,并且无法重试。在出现客户端错误时,无法重试失败的训练作业。

查看最佳训练作业

超参数优化作业使用各个训练作业返回的目标指标来评估训练作业。在超参数优化作业进行中时,最佳训练作业是迄今为止返回了最佳目标指标的作业。超参数优化作业完成后,最佳训练作业是返回了最佳目标指标的作业。

要查看最佳训练作业,请选择 Best training job (最佳训练作业)

要将最佳训练作业部署作为可以托管在 SageMaker 终端节点上的模型,请选择创建模型.

下一步

清除