获取批量推荐和用户细分 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

获取批量推荐和用户细分

要获取不需要实时更新的数据集的建议和用户细分,您可以使用仅包含历史数据的异步批处理工作流程。例如,您可能会在电子邮件列表中获取针对所有用户的产品推荐,物品间相似之处跨物品栏。或者,使用 USER_SEGUMENTION 食谱,根据库存中的商品和用户的互动创建用户细分以进行数据驱动的广告。您无需创建 Amazon Personalize 化广告系列即可获取批量推荐或创建用户细分。

  • 要获取批处理推理建议,请使用批处理推理作业。一个批量推理作业是一种从 Amazon S3 存储桶导入批量输入数据的工具,使用解决方案版本生成商品推荐,然后将建议导出到 Amazon S3 存储桶。

    输入数据可以是用户或项目的列表,也可以是每个用户列表,每个用户都有 JSON 格式的项目集合。当您想为用户获取批处理商品推荐或在库存中查找类似商品时,请使用批量推理作业。

  • 要获取用户细分,您可以使用批处理区段作业。一个批处理分段作业是一种从 Amazon S3 存储桶导入批量输入数据的工具,使用经过 USER_SEGUMENT 配方训练的解决方案版本生成用户细分针对每行输入数据,并将区段导出到 Amazon S3 存储桶。根据每个用户与库存中商品互动的概率,每个用户细分按降序排序。

    根据配方,输入数据是 JSON 格式的项目或项目元数据属性的列表。对于项目属性,输入数据可以包括基于多个元数据属性创建用户细分的表达式。在创建解决方案时使用批处理区段作业USER_SEGMENT获取最有可能与库存中每件商品互动的用户群的食谱。

对于两个批处理工作流,我们建议您使用不同的位置来存储输出数据(文件夹或其他 Amazon S3 存储桶)。要使用 PutEvents API 操作实时记录的数据,必须在创建批处理推理作业或批处理区段作业之前重新训练解决方案版本。

批处理工作流如下:

  1. 准备 JSON 格式输入数据并将其上传到 Amazon S3 存储桶。输入数据的格式取决于您使用的配方和正在创建的作业。请参阅 准备和导入批量输入数据

  2. 为输出数据创建单独的位置,可以是文件夹或其他 Amazon S3 存储桶。

  3. 创建批处理推理作业或批处理细分作业。请参阅创建批量推理作业(控制台)创建批量推理作业 (Amazon CLI),或者创建批量推理作业 (Amazon开发工具包).

  4. 批量推理或批处理区段任务完成后,从 Amazon S3 中的输出位置检索推荐或用户细分。

Batch 工作流权限要求

对于批处理工作流程,您的 Amazon Personalize IAM 服务角色需要获得访问和向 Amazon S3 存储桶添加文件的权限。有关授予权限的信息,请参阅的批处理工作流的服务相关角色. 有关存储桶权限的更多信息,请参阅用户策略示例中的Amazon Simple Storage Service 开发人员指南.

Amazon S3 存储桶和对象必须免费加密,或者如果您正在使用Amazon Key Management Service(Amazon KMS)对于加密,您必须授予 IAM 用户和 Amazon Personalize Service 角色使用密钥的权限。您还必须将 Amazon Personalize 化作为原则添加到您的Amazon KMS密钥策略。有关更多信息,请参阅 Amazon Key Management Service 开发人员指南中的使用 Amazon KMS 中的密钥策略

Batch 工作流评分

Amazon Personalize 化计算批量推理作业商品分数,如中所述获得实时推荐. 您可以在批量推理作业的输出 JSON 文件中查看分数。只有使用 HRNN 和 Personalize-Ranking 方法训练的模型才能返回分数。