进行批量预测 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

进行批量预测

当您想对整个数据集进行预测时,可以进行批量预测。

您可以进行两种类型的批量预测:

  • 手动批量预测是指您想要对数据集进行一次性预测。

  • 自动批量预测是指通过设置配置,在特定数据集更新时运行批量预测。例如,如果您为库存数据的 SageMaker Canvas 数据集配置了每周更新,则可以设置在更新数据集时运行的自动批量预测。设置自动批量预测工作流后,请参阅管理自动化操作,了解有关查看和编辑配置详细信息的更多信息。有关设置数据集自动更新的更多信息,请参阅配置数据集自动更新

注意

您只能为通过本地上传或 Amazon S3 导入的数据集设置自动批量预测。此外,自动批量预测只能在您登录 Canvas 应用程序时运行。如果您从 Canvas 注销,则在您重新登录时会恢复自动批量预测作业。

首先,请查看以下部分以了解批量预测数据集要求,然后选择以下手动或自动的批量预测工作流之一。

批量预测数据集要求

要进行批量预测,请确保您的数据集满足创建数据集中列出的要求。

您可能无法对某些数据集进行预测,因为它们具有不兼容的架构架构是一种组织结构。对于表格数据集,架构就是列的名称和列中数据的数据类型。架构不兼容可能是由于以下原因之一:

  • 您用来进行预测的数据集的列数少于您用来构建模型的数据集。

  • 您用于构建数据集的列中的数据类型可能与您用于进行预测的数据集中的数据类型不同。

  • 您用于进行预测的数据集和用于构建模型的数据集的列名不匹配。列名区分大小写。Column1column1 不同。

为确保您可以成功生成批量预测,请将批量预测数据集的架构与用于训练模型的数据集进行匹配。

注意

对于批量预测,如果您在构建模型时删除了任何列,Canvas 会将删除的列重新添加到预测结果中。但是,Canvas 不会将删除的列添加到时间序列模型的批量预测中。

进行手动批量预测

选择以下过程之一,根据您的模型类型进行手动批量预测。

使用数值和分类预测模型进行手动批量预测

要对数值或分类预测模型进行手动批量预测,请执行以下操作:

  1. 在 Canvas 应用程序的左侧导航窗格中,选择我的模型

  2. 我的模型页面上,选择您的模型。

  3. 打开模型后,选择预测选项卡。

  4. 运行预测页面上,选择批量预测

  5. 如果您已经导入了数据集,请选定选择数据集。如果未导入,请选择导入新数据集,然后将引导您完成导入数据工作流。

  6. 从可用数据集列表中,选择您的数据集并选择生成预测以获取预测。

预测作业运行完毕后,在运行预测页面上,您会看到预测下列出了输出数据集。此数据集包含您的结果,如果您选择更多选项图标 ( ),则可以选择预览来预览输出数据。您可以看到与预测相匹配的输入数据以及预测正确的概率。然后,您可以选择下载预测,将结果下载为文件。

使用图像预测模型进行手动批量预测

要对单标签图像预测模型进行手动批量预测,请执行以下操作:

  1. 在 Canvas 应用程序的左侧导航窗格中,选择我的模型

  2. 我的模型页面上,选择您的模型。

  3. 打开模型后,选择预测选项卡。

  4. 运行预测页面上,选择批量预测

  5. 如果您已经导入了数据集,请选定选择数据集。如果未导入,请选择导入新数据集,然后将引导您完成导入数据工作流。

  6. 从可用数据集列表中,选择您的数据集并选择生成预测以获取预测。

预测作业运行完毕后,在运行预测页面上,您会看到预测下列出了输出数据集。此数据集包含您的结果,如果您选择更多选项图标 ( ),则可以选择查看预测结果来查看输出数据。您可以看到图像及其预测标签和置信度分数。然后,您可以选择下载预测,将结果下载为 CSV 或 ZIP 文件。

使用文本预测模型进行手动批量预测

要对多元文本预测模型进行手动批量预测,请执行以下操作:

  1. 在 Canvas 应用程序的左侧导航窗格中,选择我的模型

  2. 我的模型页面上,选择您的模型。

  3. 打开模型后,选择预测选项卡。

  4. 运行预测页面上,选择批量预测

  5. 如果您已经导入了数据集,请选定选择数据集。如果未导入,请选择导入新数据集,然后将引导您完成导入数据工作流。您选择的数据集必须与用于构建模型的数据集具有相同的源列。

  6. 从可用数据集列表中,选择您的数据集并选择生成预测以获取预测。

预测作业运行完毕后,在运行预测页面上,您会看到预测下列出了输出数据集。此数据集包含您的结果,如果您选择更多选项图标 ( ),则可以选择预览来查看输出数据。您可以看到图像及其预测标签和置信度分数。然后,您可以选择下载预测来下载结果。

自动进行批量预测

要设置自动批量预测的时间表,请执行以下操作:

  1. 在 Canvas 的左侧导航窗格中,选择我的模型

  2. 选择您的模型。

  3. 选择预测选项卡。

  4. 选择批量预测

  5. 对于生成预测,请选择自动

  6. 此时将弹出自动批量预测对话框。选定选择数据集,然后选择要自动预测的数据集。请注意,您只能选择通过本地上传或 Amazon S3 导入的数据集。

  7. 选择数据集后,选择设置

设置配置后,Canvas 会为数据集运行批量预测作业。然后,每当您手动或自动更新数据集时,都会运行另一个批量预测作业。

预测作业运行完毕后,在运行预测页面上,您会看到预测下列出了输出数据集。此数据集包含您的结果,如果您选择更多选项图标 ( ),则可以选择预览来预览输出数据。您可以看到与预测相匹配的输入数据以及预测正确的概率。然后,您可以选择下载来下载结果。

以下几节介绍如何通过 Canvas 应用程序中的数据集页面查看、更新和删除自动批量预测配置。在 Canvas 中,您最多只能设置 20 个自动配置。有关通过自动化页面查看自动批量预测作业历史记录或更改自动配置的更多信息,请参阅管理自动化操作

查看自动批量预测作业

要查看自动批量预测作业的历史记录,请转到模型的预测选项卡。

每个自动批量预测作业都显示在模型的预测选项卡中。在预测下,您可以看到所有作业选项卡和配置选项卡:

  • 所有作业 - 在此选项卡中,您可以查看此模型的所有批量预测作业。您可以按配置名称筛选作业。对于每项作业,您可以看到诸如输入数据集(包括数据集的版本)和预测类型(例如预测是自动还是手动预测)之类的字段。如果您选择更多选项图标 ( ),则可以选择查看预测下载预测

  • 配置 - 在此选项卡中,您可以看到为此模型创建的所有自动批量预测配置。对于每种配置,您可以看到诸如创建时间的时间戳、跟踪更新的输入数据集以及计划的下一个作业之类的字段。如果您选择更多选项图标 ( ),则可以选择查看所有作业,以查看配置的作业历史记录和进行中作业。

编辑自动批量预测配置

您可能需要更改数据集的自动更新配置,例如更改更新频率。您可能还需要关闭自动更新配置以暂停对数据集的更新。

编辑批量预测配置时,您可以更改目标数据集,但不能更改频率(因为每当数据集更新时,都会自动进行批量预测)。

要编辑自动更新配置,请执行以下操作:

  1. 转到模型的预测选项卡。

  2. 预测下,选择配置选项卡。

  3. 找到您的配置并选择更多选项图标 ( )。

  4. 从下拉菜单中,选择更新配置

  5. 此时将打开自动批量预测对话框。您可以选择其他数据集并选择设置以保存更改。

您的自动批量预测配置现已更新。

要暂停自动批量预测,请执行以下操作关闭自动配置:

  1. 转到模型的预测选项卡。

  2. 预测下,选择配置选项卡。

  3. 从列表中找到您的配置,然后关闭自动更新开关。

自动批量预测现已暂停。您可以随时重新打开该开关,以恢复更新计划。

删除自动批量预测配置

要了解如何删除自动批量预测配置,请参阅删除自动配置

您也可以通过以下步骤删除配置:

  1. 转到模型的预测选项卡。

  2. 预测下,选择配置选项卡。

  3. 从列表中找到您的配置,然后选择更多选项图标 ( )。

  4. 从下拉菜单中,选择删除配置

您的配置现在应该已删除。