创建 Amazon SageMaker Autopilot 实验 - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建 Amazon SageMaker Autopilot 实验

创建 Amazon SageMaker 自动驾驶实验,您需要命名它,提供输入和输出数据的位置,指定要预测的目标数据,以及可选的要解决的机器学习问题类型。当您创建一个 Amazon SageMaker 自动驾驶工作作为试点实验, SageMaker 分析您的数据,并创建一个包含候选模型定义的笔记本。如果您选择运行完整的实验选项, SageMaker 还会代表您训练和调整这些模型。您可以在实验运行时查看统计信息。之后,您可以比较试验并深入研究细节。

  1. 开放 Amazon SageMaker 参观并登录。

  2. 选择 创建 Autopilot 实验 选项, 自动构建模型 包装盒。

    
          启动 创建 Amazon SageMaker Autopilot 实验 第页。
  3. 作业设置 形式:

    • 实验名称 – 当前帐户必须具有唯一性 AWS 区域,最多包含63个字母和数字字符。可包含连字符(-),但不包含空白。

      
              指定实验名称。
    • 输入数据位置(S3bucket) – 包含输入数据的S3bucket。

      
              指定输入数据的位置。
      注意

      必须是s3://格式的URL,其中 Amazon SageMaker 具有写入权限。S3bucket必须在当前的AW区域,且必须为CSV格式,且至少包含500行。

      • S3bucket名称 – S3中所有现有存储桶名称的存储桶名称必须唯一。

      • S3对象密钥前缀 – bucket中的对象的文件名,包括bucket内对象的路径。

      • S3存储桶位置 – S3bucket名称和S3对象密钥前缀的连结。

    • 您的S3是否输入了清单文件? – 清单文件包括包含输入数据的元数据。元数据指定了您在alirocumabS3存储中数据的位置、数据的格式化方式,以及在训练您的模型时使用的数据集属性。当您在Pipe模式下传送标记数据时,您可以使用清单文件作为预处理的替代方法。

      
              指明S3输入数据是否在清单文件中。
    • 目标属性名称 – 您希望模型以预测为目标的数据列名称。

      
              指定要预测的目标变量的名称。
    • 输出数据位置(S3bucket) – S3bucket,用于存储输出数据。

      
              指定输出数据的位置。
      注意

      必须是s3://格式的URL,其中RegionSageMaker拥有写权限。S3bucket必须在当前的AW区域。

      • S3bucket名称 – S3中所有现有存储桶名称的存储桶名称必须唯一。

      • S3对象密钥前缀 – bucket中的对象的文件名,包括bucket内对象的路径。

      • S3存储桶位置 – S3bucket名称和S3对象密钥前缀的连结。

    • 选择学习问题类型:

      
              指定学习问题的类型。
      • 自动 – SageMaker 根据您要预测的属性的值推断问题类型。在某些情况下,SageMaker 无法准确推断,在此情况下,您必须提供值才能使作业成功。

      • 二元分类 – 二元分类是一种监督学习,根据个人属性将个人分配给两个预定义和相互排斥的类别之一。例如,根据诊断检查结果对个人是否有疾病进行医学诊断。

      • 回归 – 回归基于与其相关的一个或多个其他变量或属性,估计因变量值。例如,基于房间面积和卫生间数量等特征的房屋价格。

      • 多类别分类 – 多类别分类是一种监督学习类型,根据个人属性将个人分配给几个类别之一。例如,对与文本文档最相关的主题的预测,例如政治、金融或哲学。

    • 您是否想要进行完整的实验?

      
              说明试验是完成还是试点。

      如果您选择 , SageMaker 生成模型以及统计值,在实验运行期间可以实时查看。实验完成后,您可以查看试验,按客观指标排序,然后右键单击以部署模型,以便在其他环境中使用。

      如果您选择 ,而不是执行整个工作流程, SageMaker 在生成包含候选定义的笔记本后停止执行。候选参数是数据预处理器、算法和算法参数设置的组合。您可以将笔记本用作引导自己的模型培训/培训过程的起点。笔记本中突出显示了部分,其中解释了典型的更改类型,例如更改实例类型、群集大小等。

  4. 选择 Create Experiment (创建实验)