摘要
本申请涉及一种图文搜索数据库的构建方法、装置、数据库以及存储介质。所述方法包括:对获取到的文献进行解析,提取得到所述文献的图像信息、文本信息;基于所述图像信息、所述文本信息,构建所述文献的至少一个图文对,所述图文对包括图像以及对应的图注文本;基于图像以及图注文本,生成图像的图像特征向量;从文本信息中提取所述文献的关键文本信息,基于关键文本信息,生成文献的文本特征向量;基于各文献的所述图像特征向量、所述文本特征向量,构建得到图文搜索数据库。采用本方法实现了融合文本、图像等多模态数据的文献特征提取,挖掘文献间的深层专业关联,能够提高天文领域进行图文搜索相关文献的准确率。
技术关键词
文本特征向量
图像特征向量
图文
搜索推荐方法
知识图谱路径
结构化排版
多模态特征融合
图像特征识别
主题方法
文献方法
特征提取模块
基础
关系
列表
模版
核心
系统为您推荐了相关专利信息
三维网格模型
物品展示方法
图片解码器
三维模型
图像特征向量