操作数据集架构要求(自定义) - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

操作数据集架构要求(自定义)

操作是您可能需要向客户建议的交互活动。操作可能包括安装您的移动应用、填写会员资料、加入忠诚度计划或注册促销电子邮件。操作数据集存储有关您的操作的数据。有关您可以导入 Amazon Personalize 的操作数据类型的信息,请参阅活动数据集

您为每个操作提供的数据必须与您的操作数据集架构相匹配。根据您的架构,操作元数据可能包含空/null 值。您的架构必须至少有一个 ACTION_ID 字段,并且必须为每个操作提供一个 ID。

您可以根据您的使用案例和数据添加其它字段。您可以选择字段名称和数据类型,除非字段列出为必需或保留,并且数据类型在架构数据类型中列出。

要使用分类数据,请添加类型为 string 的字段,并在架构中将该字段的类别属性设置为 true。然后,将分类数据包含在批量 CSV 文件和各个操作导入中。分类值最多可以有 1000 个字符。如果操作的分类值超过 1000 个字符,则您的数据集导入作业将失败。

对于具有多个类别的操作,使用竖线“|”分隔每个值。例如,对于 MEMBERSHIP_LEVEL 字段,您的操作数据可能是 Premium|Deluxe|Exclusive

在模型训练期间,Amazon Personalize 最多会考虑 1000 个操作。如果您导入的操作超过 1000 个,Amazon Personalize 会决定哪些操作要包含在训练中,并优先考虑新操作(您最近添加的没有交互的操作)和具有最近交互数据的现有操作。

有关操作数据集的最低要求和最大数据限制的更多信息,请参阅服务限额

操作数据集架构示例(自定义)

以下示例展示了如何构建操作架构。ACTION_ID 字段为必填项。MEMBERSHIP_LEVEL 字段是一个分类字符串字段。VALUECREATION_TIMESTAMPREPEAT_FREQUENCY 字段是具有必需类型的保留关键字。您最多可添加 10 列。有关架构要求的信息,请参阅自定义数据集和架构要求

{ "type": "record", "name": "Actions", "namespace": "com.amazonaws.personalize.schema", "fields": [ { "name": "ACTION_ID", "type": "string" }, { "name": "VALUE", "type": [ "null", "long" ] }, { "name": "MEMBERSHIP_LEVEL", "type": [ "null", "string" ], "categorical": true }, { "name": "CREATION_TIMESTAMP", "type": "long" }, { "name": "REPEAT_FREQUENCY", "type": [ "long", "null" ] }, ], "version": "1.0" }

对于此架构,CSV 文件中的前几行历史数据可能如下所示。

ACTION_ID,VALUE,MEMBERSHIP_LEVEL,CREATION_TIMESTAMP,REPEAT_FREQUENCY 1,10,Deluxe|Premium,1510003267,7 2,5,Basic,1580003267,7 3,5,Preview,1590003267,3 4,10,Deluxe|Platinum,1560003267,4 ... ...