一种基于大模型的场景检索方法及终端

AITNT
正文
推荐专利
一种基于大模型的场景检索方法及终端
申请号:CN202510563679
申请日期:2025-04-30
公开号:CN120508614A
公开日期:2025-08-19
类型:发明专利
摘要
本申请公开了一种基于大模型的场景检索方法及终端,获取特征数据集,特征数据集中包括多个训练样本,每一训练样本包括描述文本数据以及与描述文本数据对应的场景图像;将场景图像输入大语言模型得到与场景图像对应的多个问题‑答案文本;提取场景图像对应的图像特征向量以及描述文本和问题‑答案文本对应的文本特征向量;根据描述文本数据、图像特征向量以及文本特征向量训练预设的多模态匹配模型,得到训练完成的多模态匹配模型;将数据库中的目标图像逐一输入多模态匹配模型得到每一目标图像对应的文本信息;接收待定图像,得到与待定图像对应的描述信息;根据描述信息与文本信息的相似度完成检索;实现高准确度的多模态检索过程。
技术关键词
场景检索方法 文本特征向量 图像特征向量 图像特征提取模型 答案 大语言模型 矩阵 视觉 人工智能模型 生成数据集 多模态 网络 解码器 图像编码
系统为您推荐了相关专利信息
1
一种多视图融合与神经网络结合的3D物体重建方法
三维重建模型 视角 物体 联合损失函数 注意力
2
一种基于大语言模型的持续关系抽取方法及系统
大语言模型 关系抽取方法 记忆 样本 指令
3
一种基于大语言模型的丝路知识库智能问答系统
智能问答系统 大语言模型 答案 数据存储系统 数据采集模块
4
生成式AI模型实时渲染引擎构建方法及其相关设备
文本特征向量 图像特征向量 约束技术 动态更新 动态纹理
5
一种基于改进RAG与智能体工作流的知识问答方法
知识问答方法 文本 分段 摘要 表格
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号