集合类型 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

集合类型

集合类型提供了一种组织和构造数据的方法,以便进行高效的检索和分析。它们用于机器学习数据库以定义数据集及其元素的架构。在 Amaz SageMaker on Feature Store 中,支持的集合类型包括列表、集合和矢量。

集合是一组元素,集合中的每个元素都必须具有相同的特征类型(StringIntegralFractional)。例如,一个集合可以包含所有特征类型均为 Fractional 的元素,但不能包含某些特征类型为 Fractional 而某些特征类型为 String 的元素。

目前只有 InMemory 在线存储特征组支持产品系列类型。以下列表介绍了集合类型选项。

列表:元素的有序集合。

  • 列表长度由集合中的元素数量决定。

  • 示例:您可以有一个诸如 [‘a’, ‘b’, ‘a’] 之类的列表,因为该列表保留了顺序,可以有重复的元素。

:由各个唯一元素组成的无序集合。

  • 集的长度由集合中唯一元素的数量决定。

  • 示例:您不能拥有诸如 [‘a’, 'b', 'a'] 之类的集,因为它包含重复元素。该集将包含元素 [‘a’, ‘b’],因为该集仅包含唯一元素。

向量:表示固定大小的元素数组的专用列表。元素的顺序具有重要意义,因此元素的位置代表数据的某些属性。

  • 向量集合类型的元素必须 具有 Fractional 特征类型。

  • 每个在线存储 InMemory 层特征组只能有一种向量集合类型。

  • 向量的维度(向量中元素的数量)由您预先确定并使用 VectorDimension 指定。最大维度限制为 8192。

  • 示例:您可以有一个诸如 [4.2, -6.3, 4.2] 之类的向量,其中第一个、第二个和第三个元素可以表示物理空间中的 x、y 和 z 位置。

集合的长度没有限制,只要不超过记录的最大大小即可。有关记录的最大大小,请参阅配额、命名规则和数据类型