获取批量推荐和用户细分 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

获取批量推荐和用户细分

要获取不需要实时更新的数据集的建议和用户分段,您可以使用仅包含历史数据的异步批处理工作流。例如,您可能会收到电子邮件列表中所有用户的产品推荐,或者item-to-item相似之处横跨物品栏。或者使用 USER_SEGMENTION 配方,根据库存中的商品和用户互动获取数据驱动型广告的用户细分。您无需创建Amazon Personalize 广告系列即可获得批量推荐或用户细分。

  • 要获取批处理建议,请使用批处理推理作业。一个批处理推理作业是一种从 Amazon S3 存储桶导入批量输入数据的工具,使用您的解决方案版本生成物品推荐,然后将建议导出到 Amazon S3 存储桶。

    根据配方的不同,输入数据可以是用户或项目列表或用户列表,每个用户都有一组项目。输入数据必须采用 JSON 格式。当您想要为用户获取批量商品推荐或在库存中查找类似项目时,请使用批量推理作业。

  • 要获取用户细分,您可以使用批量细分作业。一个批处理分段作业是一种从 Amazon S3 存储桶导入批量输入数据的工具,它使用经过 USER_SEGMENTION 配方训练的解决方案版本来生成用户分段将分段导出到 Amazon S3 存储桶。根据每个用户与您库存中的商品互动的概率,按降序对每个用户细分进行排序。在生成用户细分时,Amazon Personalize 会考虑您单独导入的所有数据(包括创建新解决方案版本后的流式交互),但只考虑您以 FULL 导入模式导入的批量数据(替换现有数据)。

    根据配方,输入数据是 JSON 格式的项目或项目元数据属性的列表。对于项目属性,您的输入数据可以包含用于基于多个元数据属性创建用户区段的表达式。使用批处理分段任务时用户分段食谱,并希望获得最有可能与库存中的每件物品互动的用户细分。

对于这两个批处理工作流,我们建议您为输出数据使用不同的位置(文件夹或其他 Amazon S3 存储桶)。然后,您可以使用相同的输入数据位置运行多个批量推理作业。要使用您实时记录的数据 PutEvents API 操作,您必须在创建批量推理作业或批量细分作业之前重新训练解决方案版本。如果使用带有占位符参数的筛选器,则必须将输入数据中的参数值包含在filterValues对象。有关更多信息,请参阅 在输入 JSON 中提供筛选器值

批处理工作流程如下:

  1. 准备 JSON 格式的输入数据并将其上传到 Amazon S3 存储桶。输入数据的格式取决于您使用的配方和正在创建的作业。请参阅 准备和导入批量输入数据

  2. 为输出数据创建单独的位置,可以是文件夹或其他 Amazon S3 存储桶。

  3. 创建批量推理作业或批量区段作业。请参阅创建批处理推理作业(控制台)创建批处理推理作业 (Amazon CLI),或者创建批处理推理作业 (Amazon开发工具包).

  4. 批量推理或批量区段作业完成后,从 Amazon S3 中的输出位置检索推荐或用户区段。

Batch 工作流程权限要求

对于批处理工作流程,您的Amazon Personalize IAM 服务角色需要权限才能访问您的 Amazon S3 存储桶并向其添加文件。有关授予权限的信息,请参阅。批处理工作流的服务相关角色策略. 有关存储桶权限的更多信息,请参阅。用户策略示例中的Amazon Simple Storage Service 开发人员指南.

Amazon S3 存储桶和对象必须是无加密的,或者如果您使用的是Amazon Key Management Service(Amazon KMS)对于加密,您必须授予亚马逊个性化和Amazon Personalize IAM 服务角色使用密钥的权限。有关更多信息,请参阅 为 Amazon Personalize 提供使用您的的权限Amazon KMS密钥

Batch 工作流程评分

借助用户个性化和个性化排名方法,Amazon Personalize 会计算批量推断职位推荐分数,如中所述用户个性化推荐评分的工作原理个性化排名评分如何运作. 您可以在批量推理作业的输出 JSON 文件中查看分数。只有使用 “用户个性化” 和 “个性化排名” 方法训练的模型才能返回分数。