本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
创建要素组
一个FeatureGroup
是主要的要素商店资源,其中包含存储在亚马逊中的所有数据的元数据 SageMaker 功能商店。 要素组是要素存储中定义的用于描述记录的要素的逻辑分组。功能组的定义由的列表、记录标识符名称以及其在线和离线商店的配置组成。 本主题中的示例代码使用 SageMaker Python 开发工具包。底层 API 可供使用其他语言的开发人员使用。
在使用 feature store 之前,您通常会加载数据集、运行转换并设置要素以进行摄取。这个过程有很大差异,高度依赖于你的数据。以下主题中的示例代码参考简介
功能存储支持以下数据类型:String
、Fractional
(IEEE 64 位浮点值),以及Integral
(Int64-64 位有符号积分值)。默认类型设置为String
. 这意味着,如果数据集中的列不是float
要么long
类型,默认为String
在你的 feature store 里。
您可以使用架构来描述数据的列和数据类型。你把这个模式传递到FeatureDefinitions
,的必需参数FeatureGroup
. 您可以使用 SageMaker Python SDK,当您使用load_feature_definitions
function.
使用现有记录 ID 添加新要素记录时的默认行为如下。在离线商店中,将附加新记录。在在线商店中,如果新记录的事件时间小于现有事件时间不会发生,但是,如果新记录的事件时间大于或等于现有事件时间,则记录将被写入过多。