将更多训练数据导入数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将更多训练数据导入数据集

随着目录的增长,将其他训练数据导入数据集。这有助于维护和提高 Amazon Personalize 推荐的相关性。您可以通过批量或单独的数据导入操作导入更多数据。

如果要更新现有数据集以添加其它数据列,则可以将该数据集的架构替换为具有已添加的列的新架构。然后,您可以导入新的数据列。有关更多信息,请参阅 替换数据集的架构以添加新列

使用单独的导入操作导入数据

将数据导入 Amazon Personalize 数据集后,您可以通过导入其它单个记录(包括物品交互、操作交互、用户、物品或操作)对其进行更新。单独导入数据允许您随着目录的增长将小批量记录添加到您的 Amazon Personalize 数据集中。

当您单独导入记录时,Amazon Personalize 会将新记录附加到数据集中。要更新单个物品、用户或操作,可以导入具有相同 ID 但属性经过修改的记录。每次导入操作最多可以导入 10 条记录。

有关单独导入记录的更多信息,请参阅导入单个记录。有关记录实时事件的信息,请参阅记录事件

更新现有的批量数据

如果您之前为数据集创建了数据集导入任务,则可以通过创建另一个导入任务来添加或替换批量数据。默认情况下,数据集导入作业会替换您批量导入的数据集中的任何现有数据。相反,您可以通过更改作业的导入模式,将新记录附加到现有数据中。

以下是更新批量数据的指导和要求:

  • 要使用数据集导入作业将数据附加到物品交互数据集或操作交互数据集,您必须至少有 1000 条新的物品交互或操作交互记录。

  • 如果您已经创建了推荐器或通过市场活动部署了自定义解决方案版本,则新批量记录如何影响建议取决于您使用的域使用案例或食谱。有关更多信息,请参阅 新数据如何影响实时建议

  • 在完成批量导入后 20 分钟内,Amazon Personalize 会使用您的新批量数据,更新您在数据集组中创建的所有筛选条件。此更新允许 Amazon Personalize 在筛选针对用户的建议时使用最新数据。

有关创建数据集导入任务的更多信息,请参阅通过数据集导入作业导入批量记录