开始使用 Amazon SageMaker Feature Store - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon SageMaker Feature Store

要开始使用 Amazon SageMaker feature store,请查看基本概念,了解如何为功能商店提取数据,然后演练功能商店示例。以下各节介绍了如何创建要素组、将数据提取到群组以及如何管理 feature store 的安全性。 

Feature Store 概念

以下术语列表是了解 Amazon SageMaker 功能商店功能的关键: 

  • Feature Store— 作为存储、检索、删除、跟踪、共享、发现和控制对功能的访问的唯一真相来源。

  • 功能— 包含观察到的现象的可测量属性或特征。在 Amazon SageMaker 功能商店 API 中,功能是记录的属性。您可以为要素商店中存储的每个要素定义名称和类型。 名称唯一标识要素组中的要素。类型标识要素值的数据类型。支持的数据类型有:字符串、积分和分数。 

  • 功能组— AFeatureGroup是主要的要素商店资源,其中包含存储在 Amazon SageMaker 功能商店中的所有数据的元数据。 要素组是要素存储中定义的用于描述记录的要素的逻辑分组。要素组的定义由功能定义列表、记录标识符名称以及其在线和离线商店的配置组成。 

  • 功能定义— AFeatureDefinition由名称和以下数据类型之一组成:整数、字符串或小数。 一个FeatureGroup包含功能定义列表。 

  • 记录标识符名称— 每个要素组都使用记录标识符名称定义。记录标识符名称必须引用要素组的要素定义中定义的要素的名称之一。

  • RECORDS— ARecord是单个记录标识符值的要素值的集合。记录标识符名称和时间戳的组合可唯一标识要素组中的记录。 

  • 事件时间— 发生新事件的时间点,该事件对应于要素组中的记录的创建或更新。要素组中的所有记录都必须具有对应的Eventtime. 它可以用于跟踪记录随时间推移的更改。在线商店包含与最后一个对应的记录Eventtime对于记录标识符名称,而离线商店包含所有历史记录。事件时间值必须为格式的 ISO-8601 字符串。支持以下格式:yyyy-MM-dd'T'HH:mm:ssZyyyy-MM-dd'T'HH:mm:ss.SSSZ哪里yyyyMM, 和dd分别表示年、月和日,HHmmss,如果适用,SSS分别表示小时、月、秒和毫秒。TZ是常量。

  • 在线商店— 支持实时查找记录的功能组的低延迟、高可用性缓存。在线商店允许快速访问最新价值Record通过GetRecordAPI。要素组包含OnlineStoreConfig控制数据存储到的位置。

  • 离线商店OfflineStore中,将历史数据存储到 S3 存储桶中。当不需要低(亚秒)延迟读取时使用它。例如,当您想存储和提供用于探索、模型训练和批量推断的要素时。 要素组包含OfflineStoreConfig控制数据存储到的位置。

  • 摄取— 在 feature store 中填充要素组的行为。