域数据集组数 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

域数据集组数

一个域数据集组数是一个 Amazon Personalize 容器,用于存储特定于域的预配置资源,包括数据集、推荐器和筛选器。如果您有流媒体视频或电子商务应用程序,并希望让 Amazon Personalize 为您的推荐人找到最佳配置,请使用域数据集组。

一个推荐是一种针对特定用例生成推荐的资源,例如推荐类似的电影。每个地区最多可以创建 15 个推荐人。您在创建 Domain 数据集组时选择的域决定了您导入的数据以及可供推荐人使用的用例。

Amazon Personalize 每 7 天自动对支持推荐人的模特进行再培训。这是一次全面的再训练,它基于数据集中的全部数据创建全新的模型。与最适合你的精选推荐给你使用案例,Amazon Personalize 每两小时更新一次现有模型,以便在推荐中加入新项目。

您可以使用 Amazon Personalize 控制台创建域数据集组,Amazon Command Line Interface(Amazon CLI),或者Amazon开发工具包。要获取有关域数据集组的建议,请执行以下操作:

  1. 创建数据集组并选择您的业务领域。

  2. 创建包含您的域的必填字段的架构。必须先创建架构,然后才能导入数据。

  3. 格式化任何历史输入数据以匹配您的架构并将数据上载到 Amazon S3 存储桶。

  4. 将您的数据导入 Amazon Personalize 数据集,并记录用户与商品交互产生的实时事件数据。

  5. 收集到足够的数据后,请为每个用例创建推荐者。

    训练模型的最低数据要求如下:

    • 1000 条组合交互数据记录(按筛选之后eventTypeeventValueThreshold,如果提供)。

    • 25 个唯一用户,每个用户至少 2 个交互。

  6. 在你的应用程序中使用你的推荐人来获得推荐 GetRecommendations operation.

  7. 随着目录的增长,通过批量或单个数据导入操作使数据保持最新,从而保持推荐的相关性。Amazon Personalize 会管理推荐人的生命周期,并根据数据集的变化对其进行更新。

如果您从 Domain 数据集组开始,您仍然可以添加自定义资源,例如使用自定义用例的配方训练的解决方案和解决方案版本。在 Amazon Personalize 控制台中,您可以在自定义资源导航窗格中的导航窗格部分。有关自定义资源的更多信息,请参阅自定义数据集组.