常见问题 - Amazon Personalize
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

常见问题

以下是与 Amazon Personalize 中导入数据、训练、模型部署、建议和筛选器相关的常见问题解答。

有关更多问题和答案,请参阅 Amazon Personalize 示例存储库中的 Amazon Personalize 备忘单

数据导入和管理

我的批量数据应该采用什么格式?

您的批量数据必须采用逗号分隔值 (CSV) 格式。CSV 文件的第一行必须包含列标题。CSV 文件中的列标题需要映射到此架构以创建数据集。如果您的数据包含任何非 ASCII 编码字符,则必须采用 UTF-8 格式编码 CSV 文件。请勿用引号 (") 将标题括起来。TIMESTAMPCREATION_TIMESTAMP 数据必须采用 UNIX 纪元 时间格式。有关时间戳数据的更多信息,请参阅时间戳数据。有关 schema 的更多信息,请参阅 架构

有关完整的数据格式指南,请参阅数据格式指南。如果您不确定如何设置数据格式,可以使用 Amazon SageMaker Data Wrangler (Data Wrangler) 来准备数据。有关更多信息,请参阅使用 Amazon SageMaker Data Wrangler 准备和导入数据

需要多少训练数据?

对于所有使用案例(域数据集组)和自定义配方,您的交互数据必须具有以下内容:

  • 至少 1000 条来自用户与您目录中的物品进行交互的物品交互记录。这些交互可以来自批量导入,也可以来自流事件,或者两者兼而有之。

  • 至少 25 个唯一的用户 ID,每位用户至少有两次物品交互。

为获得高质量的建议,我们建议您至少有 1000 名用户的最少 5 万次物品交互,每位用户有两次或更多次物品交互。

您可以从空的物品交互数据集开始,然后在记录了足够的数据后,仅使用新记录的事件创建推荐器(域数据集组)或自定义解决方案版本。某些配方和使用案例可能有额外的数据要求。有关使用案例要求的信息,请参阅选择使用案例。有关配方要求的信息,请参阅选择配方

如何更新物品或用户的属性?

使用 Amazon Personalize 控制台或 PutItemsPutUsers 操作,导入具有相同物品 ID 但属性已修改的物品或用户。

如何删除物品或用户?

Amazon Personalize 不支持删除特定物品或用户。要确保物品或用户不显示在建议中,请使用筛选器排除物品。有关更多信息,请参阅筛选建议和用户细分

如何删除架构?

您只能通过 DeleteSchema 操作删除架构。不能使用 Amazon Personalize 控制台删除架构。

创建自定义解决方案和解决方案版本

应使用何种配方?

您使用的 Amazon Personalize 配方因您的使用案例而定。有关将使用案例与配方匹配的信息,请参阅选择配方Amazon Personalize 备忘单还包括使用案例和配方信息。

应该多久对模型进行一次再训练?

随着目录的增加以及用户与物品的交互,再训练有助于确保建议的相关性。再训练频率取决于您的业务需求和所使用的配方。对于大多数工作负载,我们建议每周创建一个新的解决方案版本,并将训练模式设置为 FULL。这会基于数据集组中数据集的全部训练数据,创建一个新的解决方案版本。

有关更多信息,请参阅维护建议相关性

是否应该使用 AutoML?

不应该使用。相反,我们建议您将使用案例与不同的 Amazon Personalize 配方进行匹配,然后选择配方。有关将使用案例与配方匹配的信息,请参阅选择配方

模型部署(自定义市场活动)

如何为市场活动设置最大事务吞吐量?

您只能设置市场活动的最低吞吐量。创建 Amazon Personalize 市场活动时,需要指定专用事务容量,用于为您的应用程序用户创建实时建议。如果您的 TPS 增加到超过 minProvisionedTPS,则 Amazon Personalize 会自动纵向扩展和缩减预调配容量,但永远不会低于 minProvisionedTPS。有关更多信息,请参阅预调配的最低每秒事务数和自动扩缩

如何监控我的市场活动费用?

Amazon Personalize Monitor 项目为 Amazon Personalize 市场活动提供 CloudWatch 控制面板、自定义指标、利用率警报和成本优化功能。请参见 Amazon Personalize 示例存储库中的 Amazon Personalize Monitor

建议

如何判断 Amazon Personalize 模型是否在生成质量建议?

使用离线和在线指标(参阅通过指标评估解决方案版本)以及在线测试(例如 A/B 测试)来评估解决方案版本的性能。有关测试的更多信息,请参阅使用 A/B 测试来衡量 Amazon Personalize 生成的建议的有效性

如何删除批量推理作业?为什么其状态为“活动”?

您无法删除批量推理作业。当批量推理作业的状态为活动时,表示作业已完成。您可以在输出 Amazon S3 存储桶或文件夹中访问您的建议。批量推理作业完成后,不会因此类作业而产生额外费用。但是,其他服务(例如 Amazon S3)可能会针对输入和输出数据存储收取额外费用。

为什么支持 SIMS 的市场活动会根据元数据推荐不相似的物品?

SIMS 使用您的物品交互数据集来确定相似度,而不是颜色或价格等物品元数据。SIMS 会识别交互数据集用户历史记录中物品的共存情况,以推荐相似物品。有关更多信息,请参阅SIMS 配方

能否通过单个 GetRecommendations API 操作获得超过 500 个物品?

500 是您可以通过单个 GetRecommendations 检索的最大物品数。此值无法增加。

筛选建议

为什么没有按预期筛选建议?

有多种原因可能导致此错误:

  • 筛选器表达式的格式或语法可能存在问题。有关格式正确的筛选器表达式的示例,请参阅筛选器表达式示例

  • Amazon Personalize 考虑每位用户每种事件类型最多 100 次最新交互。这是一个可调节的限额。您可以使用服务限额控制台请求增加限额。

有关更多信息,请参阅筛选建议和用户细分

如何从建议中删除已购买的物品?

对于 ECOMMERCE 域数据集组,如果您为为您推荐浏览 X 的客户也浏览过使用案例创建推荐器,则 Amazon Personalize 会根据您指定的 userId 和 Purchase 事件自动筛选用户购买的物品。

对于其他域数据集组使用案例或自定义资源,使用筛选器删除已购买的物品。向数据添加 Purchased 事件类型属性,通过 PutItems 操作记录购买 事件,并创建一个筛选器,从建议中删除已购买的物品。例如:

EXCLUDE ItemID WHERE Interactions.EVENT_TYPE IN ("purchased")

有关更多信息,请参阅筛选建议和用户细分