导出数据集 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

导出数据集

将数据导入 Amazon Personalize 数据集后,您可以将数据导出到 Amazon S3 存储桶。导出数据集后,您可以验证和检查 Amazon Personalize 用于生成建议的数据。您还可以实时查看之前记录的用户交互事件,并对数据执行离线分析。

您可以选择仅导出批量导入的数据(使用 Amazon Personalize 数据集导入任务导入),只导出您以增量方式导入的数据(使用控制台导入的历史记录和实时记录或PutEventsPutUsers,或者PutItems操作),或两者兼而有。

要导出数据集,请创建数据集导出作业。一个数据集导出作业是一种记录导出工具,可将数据集中的记录输出到 Amazon S3 存储桶中的一个或多个 CSV 文件中。输出 CSV 文件包含一个标题行,其列名称与数据集架构中的字段匹配。Amazon Personalize 化将重复记录(与所有字段完全匹配的记录)合并到一条记录中。

您可以使用 Amazon Personalize 化控制台创建数据集导出任务,Amazon Command Line Interface(Amazon CLI),或Amazon开发工具包。在域数据集组中为数据集创建数据集导出作业的方式与自定义数据集组中的数据集的方式相同。有关分步说明,请参阅导出数据集.