本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
训练后更新数据集中的数据
随着目录的增长,将其他训练数据导入数据集。这有助于维护和提高 Amazon Personalize 推荐的相关性。您可以通过批量或单独的数据导入操作导入更多数据。
-
对于个人导入,Amazon Personalize 会将新记录附加到数据集中。要更新单个物品、用户或操作,可以导入具有相同 ID 但属性经过修改的记录。每次导入操作最多可以导入 10 条记录。
有关单独导入记录的更多信息,请参阅将个人记录导入 Amazon Personalize 数据集。有关记录实时事件的信息,请参阅记录实时事件以影响推荐。
-
使用批量导入,您可以通过创建另一个导入任务来添加或替换批量数据。默认情况下,数据集导入作业会替换您批量导入的数据集中的任何现有数据。相反,您可以通过更改作业的导入模式,将新记录附加到现有数据中。
要使用数据集导入作业将数据附加到物品交互数据集或操作交互数据集,您必须至少有 1000 条新的物品交互或操作交互记录。在完成批量导入后 20 分钟内,Amazon Personalize 会使用您的新批量数据,更新您在数据集组中创建的所有筛选条件。此更新允许 Amazon Personalize 在筛选针对用户的建议时使用最新数据。
创建物品或用户数据集后,您可以将其架构替换为新的或现有的架构。如果数据结构在您创建数据集后发生了更改,则您可以替换该数据集的架构。例如,您可能会有想让 Amazon Personalize 在训练期间考虑的新物品元数据列。或者,您可能想要添加一列仅在筛选建议时使用的数据。有关更多信息,请参阅 替换数据集的架构以添加新列。
创建推荐版本或自定义解决方案版本后,新数据如何影响推荐取决于其类型、导入方法以及您使用的域用例或自定义配方。以下各节说明了在下一次训练之前,新数据如何影响实时推荐和批量推荐。