将数据导入域数据集组数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

将数据导入域数据集组数据集

创建域数据集组和一个或多个数据集后,即可将数据导入 Amazon Personalize。导入数据时,可以选择批量导入记录、单独导入记录或同时导入两者。通过单独导入,您可以从直播活动中导入历史记录或数据。随着您的目录不断增长,我们建议您完成其他导入数据,以使 Amazon Personalize 中的数据保持最新状态。要获得实时推荐,请通过实时记录互动来使您的Interactions数据集与用户行为保持同步事件使用事件跟踪器和PutEventsoperation.

如果您有大量的历史记录,我们建议您先批量导入数据,然后随着目录的增长逐个添加数据。保持数据最新有助于保持建议的相关性。如果你完成了创建域数据集组,您可能已经导入了交互数据。

导入批量记录

重要

默认情况下,数据集导入作业会替换批量导入的数据集中的任何现有数据。导入批量记录后,可以通过配置作业的导入模式来添加新的批量记录,而无需替换现有数据。

您可以使用数据集导入任务将批量记录导入到 Amazon Personalize 数据集中。一个数据集导入作业是一个批量导入工具,它使用来自 Amazon S3 存储桶的数据填充数据集。您可以使用 Amazon Personalize 控制台创建数据集导入任务并导入批量记录,Amazon Command Line Interface(Amazon CLI),或者Amazon数据开发工具包。

为域数据集组中的数据集创建数据集导入作业的方法与为自定义数据集组中的数据集创建数据集导入作业的方法相同。您可以批量导入记录,也可以导入单个记录。有关分步说明,请参阅使用数据集导入作业导入记录.

单独导入记录

创建 Domain 数据集组和数据集后,可以单独导入一个或多个新记录,包括交互事件、用户或项目添加到现有数据集。单独导入记录允许您随着目录的增长将一条或多条记录导入到 Amazon Personalize 数据集中。您可以单独将记录批量导入数据集,也可以将导入实时流式传输到数据集以对其进行更新。

您可以使用Amazon Personalize 控制台单独导入记录,Amazon CLI,或者Amazon数据开发工具包。单独导入记录的方法与自定义数据集组中的数据集的导入方式相同。有关分步说明,请参阅导入单个记录.