一种基于大模型的场景检索方法及终端

正文

推荐专利

一种基于大模型的场景检索方法及终端

申请号：CN202510563679

申请日期：2025-04-30

公开号：CN120508614A

公开日期：2025-08-19

类型：发明专利

摘要

本申请公开了一种基于大模型的场景检索方法及终端，获取特征数据集，特征数据集中包括多个训练样本，每一训练样本包括描述文本数据以及与描述文本数据对应的场景图像；将场景图像输入大语言模型得到与场景图像对应的多个问题‑答案文本；提取场景图像对应的图像特征向量以及描述文本和问题‑答案文本对应的文本特征向量；根据描述文本数据、图像特征向量以及文本特征向量训练预设的多模态匹配模型，得到训练完成的多模态匹配模型；将数据库中的目标图像逐一输入多模态匹配模型得到每一目标图像对应的文本信息；接收待定图像，得到与待定图像对应的描述信息；根据描述信息与文本信息的相似度完成检索；实现高准确度的多模态检索过程。

技术关键词

场景检索方法文本特征向量图像特征向量图像特征提取模型答案大语言模型矩阵视觉人工智能模型生成数据集多模态网络解码器图像编码

系统为您推荐了相关专利信息

一种多视图融合与神经网络结合的3D物体重建方法

三维重建模型视角物体联合损失函数注意力

一种基于大语言模型的持续关系抽取方法及系统

大语言模型关系抽取方法记忆样本指令

一种基于大语言模型的丝路知识库智能问答系统

智能问答系统大语言模型答案数据存储系统数据采集模块

生成式AI模型实时渲染引擎构建方法及其相关设备

文本特征向量图像特征向量约束技术动态更新动态纹理

一种基于改进RAG与智能体工作流的知识问答方法

知识问答方法文本分段摘要表格

一种基于大模型的场景检索方法及终端

站点导航

APP 下载