开始使用 Amazon SageMaker 功能商店 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon SageMaker 功能商店

要开始使用 Amazon SageMaker feature store,请查看基本概念,了解如何为您的要素存储提取数据,然后逐步了解要素存储示例。以下各节介绍了如何创建要素组、将数据引入组以及如何管理 feature store 的安全性。 

功能存储概念

以下术语列表是了解 Amazon SageMaker 功能商店功能的关键: 

  • 功能存储— 用作存储、检索、删除、跟踪、共享、发现和控制对要素的访问的单一真相来源。

  • 功能— 封装观察到的现象的可测量属性或特征。在 Amazon SageMaker 功能商店 API 中,要素是记录的属性。您可以为 “要素存储” 中存储的每个要素定义名称和类型。 名称可唯一标识要素组中的要素。类型标识要素值的数据类型。支持的数据类型包括:字符串,积分和分数。 

  • 功能组— AFeatureGroup是主要的要素存储资源,其中包含存储在 Amazon SageMaker 功能商店中的所有数据的元数据。 要素组是要素的逻辑分组,在要素存储中定义,用于描述记录。功能组定义由功能定义列表、记录标识符名称以及其在线和离线存储的配置组成。 

  • 功能定义— AFeatureDefinition由名称和以下数据类型之一组成:整数、字符串或小数。 AFeatureGroup包含功能定义列表。 

  • 记录标识符名称— 每个要素组都使用记录标识符名称进行定义。记录标识符名称必须引用在要素组的要素定义中定义的要素的名称之一。

  • 录音— ARecord是单个记录标识符值的要素值的集合。记录标识符名称和时间戳的组合可唯一标识要素组中的记录。 

  • 事件时间— 发生新事件的时间点,该事件对应于功能组中的创建或更新记录。要素组中的所有记录必须具有一个对应的Eventtime. 它可用于跟踪随着时间推移对记录的更改。在线商店包含对应于最后Eventtime作为记录标识符名称,而脱机存储包含所有历史记录。事件时间值必须是格式中的 ISO-8601 字符串。支持以下格式yyyy-MM-dd'T'HH:mm:ssZyyyy-MM-dd'T'HH:mm:ss.SSSZ其中yyyyMM, 和dd分别表示年、月和日和HHmmss, 并且如果适用,SSS代表小时,月,秒和毫秒。TZ是常量。

  • 在线商店— 支持实时查找记录的功能组的低延迟、高可用性缓存。在线商店允许快速访问最新的价值Record通过GetRecordAPI。要素组包含OnlineStoreConfig控制数据存储到的位置。

  • 离线存储OfflineStore,将历史数据存储在 S3 存储桶中。当不需要低(亚秒)延迟读取时使用该功能。例如,当您想要存储和提供用于探索、模型训练和批量推理的要素时。 要素组包含OfflineStoreConfig控制数据存储到的位置。

  • 摄入— 在要素 feature store 中填充要素组的操作。