启用实时向量嵌入蓝图之前的注意事项
Managed Service for Apache Flink 应用程序仅支持在输入流中使用非结构化文本或 JSON 数据。
支持以下两种输入处理模式:
如果输入数据为非结构化文本,则嵌入整条文本消息。向量数据库中包含原始文本和生成的嵌入。
当输入数据为 JSON 格式时,应用程序允许您在 JSON 对象值中配置和指定一个或多个键,以用于嵌入过程。如果有多个键,则所有键将共同向量化,并在向量数据库中建立索引。向量数据库将包含原始消息和生成的嵌入。
嵌入生成:该应用程序支持专门由 Bedrock 提供的所有文本嵌入模型。
持久保留在向量数据库存储中:该应用程序使用客户账户中的现有 OpenSearch 集群(预置或无服务器),作为持久保留嵌入数据的目的地。使用 Opensearch 无服务器创建向量索引时,请务必使用向量字段名称 embedded_data。
与 MSF 蓝图类似,您需要管理基础设施,以运行与实时向量嵌入蓝图相关的代码。
与 MSF 蓝图类似,一旦创建 MSF 应用程序后,必须使用控制台或 CLI 以独占方式在 Amazon 账户中启动应用程序。Amazon 不会为您启动 MSF 应用程序。必须调用 StartApplication API(通过 CLI 或控制台)才能让应用程序运行起来。
跨账户移动数据:该应用程序不允许在输入流和位于不同 Amazon 账户的向量目的地之间移动数据。