在线存储 - Amazon SageMaker
Amazon Web Services 文档中描述的 Amazon Web Services 服务或功能可能因区域而异。要查看适用于中国区域的差异,请参阅 中国的 Amazon Web Services 服务入门 (PDF)

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

在线存储

在线存储是一种低延迟、高可用性数据存储,支持实时查找特征。它通常用于机器学习 (ML) 模型处理。创建特征组时,您可以在标准在线存储 (Standard) 或内存层在线存储 (InMemory) 之间进行选择。这样,您就可以在考虑性能和成本的同时,选择与特定应用程序的读取和写入模式最匹配的存储类型,有关定价的更多详情,请参阅 Amazon SageMaker 定价

在线存储包含以下 StorageType 选项。有关在线商店内容的更多信息,请参阅OnlineStoreConfig

标准层存储类型

Standard 层是在线存储特征组的托管低延迟数据存储。它为您的应用程序提供机器学习模型服务的快速数据检索。Standard 是默认存储类型。

内存层存储类型

InMemory 层是在线存储特征组的托管数据存储,支持极低延迟检索。它为用于高吞吐量应用程序的机器学习模型处理提供大规模实时数据检索。该InMemory等级由 Amazon 提供支持, ElastiCache 适用于 Redis。有关更多信息,请参阅什么是 Amazon for ElastiCache Redis? 。

在线存储 InMemory 层支持集合类型,即列表、集和向量。有关InMemory集合类型的更多信息,请参阅集合类型

Feature Store 提供对在线存储的低延迟读取和写入。应用程序延迟主要由两个部分组成:基础设施或网络延迟以及 Feature Store API 延迟。降低网络延迟有助于以极低的延迟读取和写入 Feature Store。您可以通过部署 Amazon PrivateLink 到功能存储运行时端点来减少功能存储的网络延迟。借助 Amazon PrivateLink,您可以使用接口 VPC 终端节点,以可扩展的方式从您的亚马逊虚拟私有云 (VPC) 私有访问所有功能商店运行时 API 操作。privateDNSEnabled选项设置为 true 的 Amazon PrivateLink 部署:

  • 它将所有 Feature Store 的读/写流量保留在您的 VPC 内。

  • 使用 Feature Store 时,它会将流量保留在与发起流量的客户端相同的 AZ 中。这样可以避免 AZ 之间的“跳跃”,从而降低网络延迟。

按照使用接口 VPC 终端节点访问 Amazon 服务中的步骤设置 Amazon PrivateLink 功能存储。中的 Feature Store Runtime 的服务名称 Amazon PrivateLink 为com.amazonaws.region.sagemaker.featurestore-runtime

InMemory层在线商店会根据存储使用量和请求量自动扩展。如果新的使用模式变化很快,自动扩缩可能需要几分钟时间才能适应。在自动扩缩期间:

  • 对特征组的写入操作可能会收到节流错误。应在几分钟后重试您的请求。

  • 对特征组的读取操作可能会收到节流错误。标准重试策略适用于这种情况。

  • 读取操作可能会导致延迟增加。

默认 InMemory 层特征组的最大大小为 50 GiB。

请注意,InMemory 层目前仅支持在线特征组,不支持在线+离线特征组,因此 InMemory 层的在线和离线存储之间无法进行复制。此外,InMemory 层目前不支持客户托管的 KMS 密钥。