创建功能组 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅中国的 Amazon Web Services 服务入门

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

创建功能组

AFeatureGroup是主要的要素存储资源,其中包含存储在 Amazon SageMaker 功能商店中的所有数据的元数据。 要素组是要素的逻辑分组,在要素存储中定义,用于描述记录。功能组定义由功能定义列表、记录标识符名称以及其在线和离线存储的配置组成。 本主题中的示例代码使用 SageMaker Python 软件开发工具包。底层 API 可供使用其他语言的开发人员使用。

在使用要素存储之前,通常需要加载数据集、运行转换并设置要素以进行引入。此过程有很多变化,并且高度依赖于您的数据。以下主题中的示例代码参考功能存储简介利用 Amazon SageMaker 功能检测欺诈示例笔记本电脑。我们建议您在 Amazon SageMaker Studio 中运行此笔记本电脑,因为本指南中的代码是概念性的,如果复制,则无法完全正常工作。

功能存储支持以下数据类型:StringFractional(IEEE 64 位浮点值)和Integral(Int64-64 位有符号积分值)。默认类型设置为String. 这意味着,如果数据集中的列不是float或者long类型,则默认为String在要素存储中。

您可以使用模式来描述数据的列和数据类型。您将此模式传递给FeatureDefinitions,它是一个必需的参数,FeatureGroup. 您可以使用 SageMaker Python SDK,当您使用load_feature_definitionsfunction. 

使用已存在的记录 ID 添加新要素记录时,默认行为如下。在脱机存储中,将追加新记录。在联机商店中,如果新记录的事件时间小于现有事件时间,则不会发生任何事件,但是,如果新记录的事件时间大于或等于现有事件时间,则记录将被覆盖。