开始使用 Amazon SageMaker Feature Store - Amazon SageMaker
AWS 文档中描述的 AWS 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 AWS 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

开始使用 Amazon SageMaker Feature Store

要开始使用 Amazon SageMaker Feature Store,请查看基本概念,了解如何为功能存储提取数据,然后演练一个Feature Store示例。以下部分介绍如何创建功能组、将数据提取到组以及如何管理功能存储的安全性。 

Feature Store 概念

以下术语列表是了解 功能的关键Amazon SageMaker Feature Store: 

  • 功能存储 – 充当存储、检索、删除、跟踪、共享、发现和控制功能访问的单个可信来源。

  • 特征 – 封装观察到的现象的可测量属性或特征。在 Amazon SageMaker Feature Store API 中,功能是记录的一个属性。您可以为存储在 中的每个功能定义名称和类型Feature Store。Name (名称) 唯一标识功能组中的某个功能。Type (类型) 标识特征值的数据类型。支持的数据类型包括:String、Integral 和小数。 

  • 功能组 – A FeatureGroup 是主要Feature Store资源,其中包含存储在 中的所有数据的元数据Amazon SageMaker Feature Store。功能组是功能存储中定义的用于描述记录的逻辑功能组。功能组的定义由功能定义列表、记录标识符名称和在线和离线存储的配置组成。 

  • 特征定义FeatureDefinition 包含名称和下列数据类型之一:Integral、String 或 小数。A FeatureGroup 包含特征定义的列表。 

  • 记录标识符名称 – 每个功能组都使用记录标识符名称定义。记录标识符名称必须引用在功能组的功能定义中定义的功能名称之一。

  • 记录 – A Record 是单个记录标识符值的特征值集合。记录标识符名称和时间戳的组合唯一标识功能组中的记录。 

  • 发生与在特征组中创建或更新记录对应的新事件时的事件–时间点。功能组中的所有记录都必须具有相应的 Eventtime。它可用于跟踪一段时间内对记录的更改。在线存储包含与 last Eventtime对应的记录(对于记录标识符名称),而脱机存储包含所有历史记录。事件时间值必须为 格式的 ISO-8601 字符串。支持以下格式yyyy-MM-dd'T'HH:mm:ssZyyyy-MM-dd'T'HH:mm:ss.SSSZ其中 yyyyMM和 分别dd表示年份、月份和日期HHmmss、 和 (如果适用) 表示以复制方式SSS表示小时、月份、秒和毫秒。TZ 是常量。

  • Online (在线) 存储–功能组的低延迟、高可用性缓存,以便能够实时查找记录。在线商店允许Record通过 GetRecord API 快速访问 的最新值。功能组包含用于存储数据的 OnlineStoreConfig控制。

  • 离线存储OfflineStore,将历史数据存储在 S3 存储桶中。当不需要低(亚秒)延迟读取时,会使用它。例如,当您想要存储和服务用于探索、模型训练和批处理推理的功能时。 功能组包含用于存储数据的 OfflineStoreConfig 控制。

  • Ingestion (提取) – 在特征存储中填充特征组的行为。