获取批量建议 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

获取批量建议

借助自定义资源,您可以通过异步批量流获得物品建议。例如,您可能会收到电子邮件列表中所有用户的产品推荐或库存中的item-to-item相似之处

要获取物品的批量建议,您可以使用批量推理作业。批量推理作业 是一种工具,可从 Amazon S3 存储桶导入您的批量输入数据,使用您的自定义解决方案版本生成物品建议,然后将物品建议导出到 Amazon S3 存储桶。根据食谱,您的输入数据是用户或物品列表,或者是用户列表,每个用户列表都含有一组物品。

如果您的解决方案使用 Similar Items 配方,并且您的物品数据集包含文本数据和物品标题数据,则可以为每组物品生成带有主题的批量建议。有关更多信息,请参阅内容生成器中带有主题的批量建议

生成批量建议时,Amazon Personalize 会考虑在创建最新解决方案版本时存在的所有批量数据。可以使用“完整”或“增量”导入模式,导入这些数据。要使较新的批量记录影响批量建议,您必须创建新的解决方案版本,然后创建批量推理作业。

Amazon Personalize 在生成批量建议时使用来自单个导入的数据,如下所示:

  • 与现有物品和用户的新交互:如果您使用 User-Personalization 或 Personalized-Ranking 食谱,则 Amazon Personalize 会在数据导入后约 15 分钟内考虑与现有物品和用户的新交互数据。为确保考虑事件,我们建议您在导入后至少等待 15 分钟,然后再开始批量推理作业。对于所有其他食谱,您必须为流事件创建新的解决方案版本以影响批量建议。

  • 新用户:对于没有交互数据的用户,建议最初仅针对热门物品。如果您使用 User-Personalization 或 Personalized-Ranking,并为用户记录事件,则其建议可能会在导入后约 15 分钟内变得更加相关,而无需重新训练。为确保考虑事件,我们建议您在导入后至少等待 15 分钟,然后再开始批量推理作业。对于所有其他食谱,您必须为流事件创建新的解决方案版本,以影响用户的批量建议,而无需交互数据。

  • 新物品:对于 User-Personalization,当您创建批量推理作业并为解决方案指定经过全面训练的最新解决方案版本时,Amazon Personalize 会自动更新解决方案版本,以便在浏览建议中加入新物品。如果您不指定最新解决方案版本,则不会进行更新。对于任何其他食谱,您都必须创建一个新的解决方案版本,以便在批量建议中包含新物品。有关浏览的更多信息,请参阅探索

批量工作流程

批量工作流程如下所示:

  1. 准备好您的输入数据并以 JSON 格式将其上传到 Amazon S3 存储桶。输入数据的格式取决于您使用的食谱。请参阅 为批量建议准备输入数据

  2. 为输出数据创建一个单独的位置,可以是文件夹,也可以是其他 Amazon S3 存储桶。

  3. 创建批量推理作业。请参阅 创建批量推理作业

  4. 批量推理完成后,从 Amazon S3 中的输出位置检索物品建议。

指南和要求

以下是获取批量建议的指南和要求:

  • 您的 Amazon Personalize IAM 服务角色必须有权读取文件并将其添加到您的 Amazon S3 存储桶。有关授予权限的信息,请参阅批量工作流程的服务角色策略。有关存储桶权限的更多信息,请参阅《Amazon Simple Storage Service 开发人员指南》中的用户策略示例。如果您使用 Amazon Key Management Service (Amazon KMS) 进行加密,则必须向 Amazon Personalize 和 Amazon Personalize IAM 服务角色授予使用您的密钥的权限。有关更多信息,请参阅向 Amazon Personalize 授予使用您 Amazon KMS 密钥的权限

  • 在创建批量推理作业之前,必须创建自定义解决方案和解决方案版本。不过,您无需创建 Amazon Personalize 市场活动。如果您创建了域数据集组,则仍然可以创建自定义资源。

  • 要生成带有建议的主题,您必须使用 Similar-Items 配方。而且您必须有一个包含文本数据和物品标题数据的物品数据集。有关带有主题的建议的更多信息,请参阅内容生成器中带有主题的批量建议

  • 输入数据的格式必须按为用户细分准备输入数据所述来设置。

  • 您无法通过 Trending-Now 或 Next-Best-Action 配方获得批量建议。

  • 如果您使用带有占位符参数的筛选器,则必须在 filterValues 对象的输入数据中包含参数的值。有关更多信息,请参阅在您的输入 JSON 中提供筛选器值

  • 我们建议您使用与输入数据不同的位置来存储输出数据(文件夹或其他 Amazon S3 存储桶)。

  • Batch 推荐可能与实时推荐不完全相同。这是因为批量推理作业需要更长的时间才能完成,并且只考虑作业开始前 15 分钟可用的数据。

批量工作流程评分

批量建议包括以下分数: