

本文属于机器翻译版本。若本译文内容与英语原文存在差异，则一律以英文原文为准。

# 特征处理器 SDK 数据源
<a name="feature-store-feature-processor-data-sources-sdk"></a>

适用于 Python 的亚马逊 SageMaker 功能商店功能处理器 SDK (Boto3) 提供了从存储在 Amazon S3 中的功能组或对象加载数据的结构。有关 Feature Store 提供的数据源定义的完整列表，请参阅[特征处理器数据源 Feature Store Python SDK](https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/feature_store/feature_processor/_data_source.py)。

有关如何使用 Feature Store Python SDK 数据源定义的示例，请参阅[常见使用案例的特征处理代码示例](feature-store-feature-processor-examples.md)。

## FeatureGroupDataSource
<a name="feature-store-feature-processor-data-sources-sdk-featuregroup"></a>

`FeatureGroupDataSource` 用于将特征组指定为特征处理器的输入数据源。可以从离线存储特征组加载数据。尝试从在线存储特征组加载数据将会导致验证错误。您可以指定开始偏移和结束偏移，将加载的数据限制在特定时间范围内。例如，可以指定一个“14 天”的开始偏移，以便仅加载最近两周的数据；还可以指定一个“7 天”的结束偏移，以便将输入限制为前一周的数据。

## Feature Store 提供的数据源定义
<a name="feature-store-feature-processor-data-sources-sdk-provided-sources"></a>

Feature Store Python SDK 包含数据源定义，可用于为特征处理器指定各种输入数据源。其中包括 CSV、Parquet 和 Iceberg 表源。有关 Feature Store 提供的数据源定义的完整列表，请参阅[特征处理器数据源 Feature Store Python SDK](https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/feature_store/feature_processor/_data_source.py)。