数据见解 - Amazon Personalize

数据见解

以下是您可以在 Amazon Personalize 中生成的可能的数据见解。

见解	操作	相关数据集
交互数据集只有 X 次交互。模型训练至少需要 1000 次交互。我们建议至少 5 万次交互。	在训练模型之前，导入 Y 条额外唯一交互记录。	物品交互
交互数据集只有 X 个具有两个或更多交互的唯一用户。模型训练需要至少 25 个这样的用户。我们建议至少 1000 个用户。	为其他 Y 个用户中的每个用户导入至少 2 条交互记录。	物品交互
物品数据集中有 X% 的物品在交互数据集中没有交互，因此可能不建议使用它们。	请务必导入所有交互数据，并检查您的物品和交互数据集之间是否存在不匹配的 ID。查看下面有关物品和交互数据集的数据集统计信息，确保导入的行数达到了预期的行数。如果您的使用案例或食谱使用浏览，请修改浏览配置，以建议更多没有交互数据的物品。	物品交互和物品
用户数据集中有 X% 的用户在交互数据集中没有交互。这些用户将收到热门物品的建议。	请务必导入所有交互数据，并检查您的用户和交互数据集之间是否存在不匹配的 ID。查看下面有关用户和交互数据集的数据集统计信息，确保导入的行数达到了预期的行数。导入任何其他交互，以便更多用户拥有交互数据。	物品交互和用户
<用户或物品或交互> 数据集有 X% 的行缺失值。这可能会对建议产生负面影响。我们建议所有必填字段和可选字段的填写率至少为 70%。	导入其他完整记录，或者在没有不完整行的情况下再次导入数据，或者在将缺失值替换为替代数据（例如数值列的平均值或类别列的最常见值）的情况下再次导入数据。	任何
<datasetType>数据集中以下各列的完成度不到 70%：< ColumnName、 ColumnName... >。如果这些数据包含在训练中，可能会对建议产生负面影响。我们建议允许空值的列的填写率至少为 70%。	导入其他完整记录，或者在没有不完整行的情况下再次导入数据，或者在将缺失值替换为替代数据（例如数值列的平均值或类别列的最常见值）的情况下再次导入数据。	任何
以下（数字）列具有异常值：< ColumnName、 ColumnName... >。异常值不一定是问题，但有时会对建议产生负面影响。	使用下面的列统计信息，检查这些列的最小值和最大值是否符合您的预期。如果这些值出乎意料，请检查这些列中的数据是否存在不准确之处，并查看您的数据收集和数据处理是否存在问题。	任何
以下列有 1000 多个可能的类别：< ColumnName、 ColumnName... >。如果这些数据包含在训练中，则可能会对建议产生负面影响：<ColumnName， ColumnName... >。	检查您的分类数据是否存在问题，例如拼写差异导致的重复类别。纠正任何不准确之处并重新导入数据。	任何
以下文本元数据列的完成率不到 85%，不会用于模型训练：<ColumnName， ColumnName... >。	导入其他行或使用这些列的文本数据重新导入行。	物品
交互数据集有 10 多个唯一的事件类型，这将导致模型训练失败。	检查您的事件类型列中是否存在不准确之处，例如拼写差异导致的事件类型重复。删除不必要的事件类型并重新导入数据。	物品交互
交互数据集的所有记录都具有相同的时间戳。如果您使用 USER_SEGMENTATION 食谱，并且所有记录都具有相同的时间戳，则模型训练将失败。	检查您的数据是否存在时间戳问题，并将重复的时间戳替换为唯一的时间戳。	物品交互

Javascript 在您的浏览器中被禁用或不可用。

要使用 Amazon Web Services 文档，必须启用 Javascript。请参阅浏览器的帮助页面以了解相关说明。

分析数据所需的权限

查看数据集见解和统计信息