域数据集组 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

域数据集组

一个域数据集组是一个 Amazon Personalize 化容器,用于特定于域的预配置资源,包括数据集、推荐者和筛选器。如果您有直播视频或电子商务应用程序,并希望让 Amazon Personalize 化为推荐者找到最佳配置,请使用域数据集组。

一个推荐者是为特定使用案例(例如推荐类似电影)生成建议的资源。你每个人最多可以创建 5 个推荐者Amazonaccount. 创建域数据集组时选择的域决定了您导入的数据以及推荐者可用的使用案例。

Amazon Personalize 化每 7 天自动重新训练一次支持推荐人的模型。这是一次完整的再训练,它根据数据集中的全部数据创建全新的模型。借助 “适合你的热门选择” 和 “推荐给你的使用案例”,Amazon Personalize 化每两小时更新一次现有模型,以便在推荐中包含探索内容。

您可以使用 Amazon Personalize 化控制台创建域数据集组,Amazon Command Line Interface(Amazon CLI),或者Amazon开发工具包。要获取有关 Domain 数据集组的推荐,请执行以下操作:

  1. 创建数据集组并选择您的业务域。

  2. 创建一个包含域名必填字段的架构。在导入数据之前,必须先创建架构。

  3. 格式化任何历史输入数据以匹配您的架构(必填字段和类型列表),然后将数据上传到 Amazon S3 存储桶中。

  4. 将您的数据导入 Amazon Personalize 化数据集,并记录来自用户与物品交互的实时事件数据。

  5. 当您收集了足够的数据后,请为每个使用案例创建推荐者。

    训练模型的最低数据要求如下:

    • 1000 条组合交互数据记录(筛选条件后)eventTypeeventValueThreshold,如果提供)。

    • 25 个独特用户,每个用户至少 2 个交互。

  6. 使用你的应用程序中的推荐者通过 getCompments 操作 GetRecommendations。

  7. 随着目录的增长,通过批量或增量数据导入操作使数据保持最新状态来保持建议的相关性。Amazon Personalize 化管理推荐人的生命周期,并随着数据集的变化进行更新。

如果您从域数据集组开始,您仍可以添加自定义资源,例如经过自定义用例配方训练的解决方案和解决方案版本。在 Amazon Personalize 化控制台中,您可以在自定义资源部分的导航窗格中。有关自定义资源的更多信息,请自定义数据集组.