创建要素组 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建要素组

一个FeatureGroup是主要的要素商店资源,其中包含存储在亚马逊中的所有数据的元数据 SageMaker 功能商店。 要素组是要素存储中定义的用于描述记录的要素的逻辑分组。功能组的定义由的列表、记录标识符名称以及其在线和离线商店的配置组成。 本主题中的示例代码使用 SageMaker Python 开发工具包。底层 API 可供使用其他语言的开发人员使用。

在使用 feature store 之前,您通常会加载数据集、运行转换并设置要素以进行摄取。这个过程有很大差异,高度依赖于你的数据。以下主题中的示例代码参考简介亚马逊进行欺诈侦测 SageMaker 功能还原例如笔记本。我们建议您在亚马逊运行此笔记本电脑。 SageMaker Studio 因为本指南中的代码是概念性的,如果复制的话不能完全正常运行。

功能存储支持以下数据类型:StringFractional(IEEE 64 位浮点值),以及Integral(Int64-64 位有符号积分值)。默认类型设置为String. 这意味着,如果数据集中的列不是float要么long类型,默认为String在你的 feature store 里。

您可以使用架构来描述数据的列和数据类型。你把这个模式传递到FeatureDefinitions,的必需参数FeatureGroup. 您可以使用 SageMaker Python SDK,当您使用load_feature_definitionsfunction. 

使用现有记录 ID 添加新要素记录时的默认行为如下。在离线商店中,将附加新记录。在在线商店中,如果新记录的事件时间小于现有事件时间不会发生,但是,如果新记录的事件时间大于或等于现有事件时间,则记录将被写入过多。