监控超参数优化作业的进度 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

监控超参数优化作业的进度

要监控超参数优化作业的进度以及它启动的训练作业,请使用亚马逊 SageMaker 控制台。

查看超参数优化作业的状态

查看超参数优化作业的状态

  1. 打开 Amazon SageMaker 控制台在https://console.aws.amazon.com/sagemaker/.

  2. 选择 Hyperparameter tuning jobs (超参数优化作业)

  3. 在超参数优化作业列表中,检查您启动的超参数优化作业的状态。优化作业可以处于:

    • Completed超参数优化作业成功完成。

    • InProgress超参数优化作业正在进行。一个或多个训练作业仍在运行。

    • Failed超参数优化作业失败。

    • Stopped超参数优化作业在完成之前被手动停止。超参数优化作业启动的所有训练作业已停止。

    • Stopping超参数优化作业正在停止。

查看训练作业的状态

查看超参数优化作业启动的训练作业的状态

  1. 在超参数优化作业列表中,选择您启动的作业。

  2. 选择 Training jobs (训练作业)

  3. 查看各个训练作业的状态。要查看有关作业的详细信息,请在训练作业列表中选择该作业。要查看超参数优化作业启动的所有训练作业的状态摘要,请查看 Training job status counter (训练作业状态计数器)

    训练作业的状态可以为:

    • Completed— 训练作业已成功完成。

    • InProgress— 训练作业正在进行。

    • Stopped训练作业在完成之前被手动停止。

    • Failed (Retryable)— 训练作业失败,但可以重试。只有在训练作业由于出现内部服务错误而失败时,才能重试该训练作业。

    • Failed (Non-retryable)— 训练作业失败,并且无法重试。在出现客户端错误时,无法重试失败的训练作业。

查看最佳训练作业

超参数优化作业使用各个训练作业返回的目标指标来评估训练作业。在超参数优化作业进行中时,最佳训练作业是迄今为止返回了最佳目标指标的作业。超参数优化作业完成后,最佳训练作业是返回了最佳目标指标的作业。

要查看最佳训练作业,请选择 Best training job (最佳训练作业)

要将最佳训练作业部署为模型,您可以在 SageMaker 终端节点,选择创建模型.

下一个步骤

清除