

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 物品数据集架构要求（自定义）
<a name="item-dataset-requirements"></a>

 *物品数据集* 存储有关目录物品的元数据。这可能包括每件物品的价格、类型和库存等信息。有关您可以导入 Amazon Personalize 的物品数据类型的信息，请参阅[物品元数据](items-datasets.md)。

 您为每个物品提供的数据必须与您的物品数据集架构相匹配。您必须至少为每个物品提供一个物品 ID（最大长度为 256 个字符）。根据您的架构，项目元数据可以包含 empty/null 值。您的架构必须至少有一个元数据字段，但如果添加 `null` 类型，则物品的该值可以为空。您可以根据您的使用案例和数据自由添加其他字段。只要字段未列为必填字段或保留字段，并且数据类型列在[架构数据类型](how-it-works-dataset-schema.md#personalize-datatypes)中，则字段名称和数据类型由您决定。

 要使用分类数据，请添加类型为 `string` 的字段，并在架构中将该字段的类别属性设置为 `true`。然后，将分类数据包含在批量 CSV 文件和单个物品导入中。分类值最多可以有 1000 个字符。如果您的物品的分类值超过 1000 个字符，则您的数据集导入作业将失败。

 对于具有多个类别的物品，使用竖线“\|”分隔每个值。例如，对于 GENRES 字段，您的物品数据可能是 `Action|Crime|Biopic`。如果您有多个级别的分类数据，并且某些物品在层次结构中的每个级别都有多个类别，请为每个级别添加一个字段，并在每个字段名称后面附加一个级别指示符：GENRES、GENRE\_L2、GENRE\_L3。这样，您可以根据子类别筛选建议，即使一个物品属于多个多级类别，也是如此（有关创建和使用筛选器的信息，请参阅[筛选建议和用户细分](filter.md)）。例如，某个视频可能包含每个类别级别的以下数据：
+ GENRES：动作\|冒险
+ GENRE\_L2：犯罪\|西方
+ GENRE\_L3：传记片

在此示例中，该视频位于动作 > 犯罪 > 传记片层次结构*和* 冒险 > 西方 > 传记片层次结构中。我们建议使用的级别最高仅到 L3，但如有必要，可以使用更多级别。

在模型训练期间，Amazon Personalize 最多会考虑 75 万件物品。如果您导入的物品超过 75 万件，则 Amazon Personalize 会决定在训练中包含哪些物品，重点是包括新物品（您最近添加的没有交互的物品）以及含最近交互数据的现有物品。

 有关物品数据集的最低要求和最大数据限制的更多信息，请参阅[服务配额](limits.md#limits-table)。

## 物品数据集架构示例（自定义）
<a name="schema-examples-items"></a>

以下示例展示了如何构建物品架构。`ITEM_ID` 字段为必填项。`GENRE` 字段是分类元数据字段，`DESCRIPTION` 字段是文本元数据字段。至少需要一个元数据字段。您最多可以添加 100 个元数据字段。`CREATION_TIMESTAMP` 字段是保留关键字字段。有关架构要求的信息，请参阅[自定义数据集和架构要求](custom-datasets-and-schemas.md#dataset-requirements)。

```
{
  "type": "record",
  "name": "Items",
  "namespace": "com.amazonaws.personalize.schema",
  "fields": [
    {
      "name": "ITEM_ID",
      "type": "string"
    },
    {
      "name": "GENRES",
      "type": [
        "null",
        "string"
      ],
      "categorical": true
    },
    {
      "name": "CREATION_TIMESTAMP",
      "type": "long"
    },
    {
      "name": "DESCRIPTION",
      "type": [
        "null",
        "string"
      ],
      "textual": true
    }
  ],
  "version": "1.0"
}
```

对于此架构，CSV 文件中的前几行历史数据可能如下所示。

```
ITEM_ID,GENRES,CREATION_TIMESTAMP,DESCRIPTION
1,Adventure|Animation|Children|Comedy|Fantasy,1570003267,"This is an animated movie that features action, comedy, and fantasy. Audience is children. This movie was released in 2004."
2,Adventure|Children|Fantasy,1571730101,"This is an adventure movie with elements of fantasy. Audience is children. This movie was release in 2010."
3,Comedy|Romance,1560515629,"This is a romantic comedy. The movie was released in 1999. Audience is young women."
4,Comedy|Drama|Romance,1581670067,"This movie includes elements of both comedy and drama as well as romance. This movie was released in 2020."
...
...
```