摘要
本发明公开了一种数据检索方法、装置、电子设备及存储介质,涉及人工智能领域,可使用元数据库保存各文档文件的摘要信息和利用各文档文件的每一页面转换得到页面图像,以及使用向量数据库保存利用各文档文件的每一页面生成的文本向量,页面图像和文本向量均标注对应文档文件的文件标识和对应页面的页面标识。在进行文档搜索时,可在向量数据库中检索与文档文件查询信息匹配的文本向量,再使用该文本向量所标注的文件标识和页面标识,在元数据库中查询对应的页面图像,进而将页面图像输入至多模态处理模型进行回答处理,有助于多模态处理模型通过页面图像理解文本内容和图像内容的关联关系,从而提升回答质量。
技术关键词
数据检索方法
页面
文本
多模态
摘要
标识
检索系统
计算机可执行指令
数据检索装置
主题
电子设备
图像获取模块
可读存储介质
存储计算机程序
标记
输出模块
协议
系统为您推荐了相关专利信息
面向智慧园区
安防监控方法
条件概率模型
门控神经网络
节点
半结构化文本
多模态信息融合
标签框
特征值
表达式