自动模型优化的资源限制 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

自动模型优化的资源限制

SageMaker 为自动模型调整所使用的资源设置以下默认限制:

  • 并行(并发)超参数调整作业的数量:100

  • 可搜索的超参数:20

    注意

    分类超参数中的每个可能值都计入这一限制中。

  • 每个超参数优化作业的定义的指标数:20

  • 每个超级参数优化作业的并发(并发)训练作业数:10

    注意

    这可以增加到一百。

  • [贝叶斯搜索策略] 每个超参数优化作业的训练作业数: 500

  • [随机搜索策略] 每个超级参数优化作业的训练作业数:500

    注意

    这可以增加到一万。

  • 超参数优化作业的最长运行时间:30 天

在计划超参数优化作业时,还必须考虑到训练资源限制。有关 SageMaker 训练作业的默认资源限制的信息,请参阅SageMaker 限制. 所有超参数优化作业在其上运行的每个并发训练实例都计入所允许的训练实例总数内。例如,如果您运行 10 个并发超参数优化作业,每个超参数优化作业又各运行 100 个总训练作业和 20 个并发训练作业。每个训练作业在一个 ml.m4.xlarge 实例上运行。那么,下列限制适用:

  • 并发超参数优化作业数:不需要放宽限制,因为 10 个优化作业低于 100 这一限制。

  • 每个超参数优化作业的训练作业数:您无需放宽限制,因为 100 个训练作业低于 500 这一限制。

  • 每个超级参数优化作业的并发训练作业数:您需要将限制放宽到 20,因为默认限制为 10。

  • SageMaker 训练ml.m4.xlarge实例:需要请求将限制放宽到 200,因为您有 10 个超参数优化作业,每个超参数优化作业又各运行 20 个并发训练作业。默认限制为 20 个实例。

  • SageMaker 培训总实例计数:需要请求将限制放宽到 200,因为您有 10 个超参数优化作业,每个超参数优化作业又各运行 20 个并发训练作业。默认限制为 20 个实例。

请求提高配额:

  1. 打开Amazon支持中心页面,登录(如有必要),然后选择创建案例.

  2. Create case (创建案例) 页面上,选择 Service limit increase (增加服务限制)

  3. 在存储库的Case 详细信息面板中,选择SageMaker 自动模型优化 [超参数优化](对于 )限制类型

  4. 在存储库的请求面板中返回的请求 1中,选择区域,资源限制来增加,New 限制值您正在请求。Select添加其他请求如果您有额外的配额增加请求。

    
            资源限制增加请求 UI。
  5. 案例描述面板中,提供您的使用案例的描述。

  6. 联系选项面板中,选择您的首选联系方式(Web聊天或者Phone),然后选择提交.