摘要
本发明公开了基于大数据的图文检索方法及系统,本发明涉及数据处理技术领域,解决了缺乏根据数据特点和用户需求动态调整筛选条件的能力,无法充分挖掘图文之间的内在联系,难以精准匹配用户需求的技术问题,本发明通过对图像信息提取颜色、纹理、形状等多维度特征,对文本信息采用词袋模型提取特征,实现了对图文信息的深度挖掘,能更全面地代表图文的本质特征,提高了检索的精准度,进行单一匹配、关联度计算筛选,再进行二次匹配,文本特征与图像特征匹配结果进一步结合筛选,最后对组合检索结果再次进行匹配筛选,多层级的筛选机制能有效排除不相关信息,从海量数据中精准定位符合要求的图文,大大提高了检索结果的质量。
技术关键词
图文检索方法
图像匹配
文本
生成图文
生成图像特征
大数据
特征提取模块
分布直方图
纹理特征
输出模块
分析模块
颜色
词袋模型
数据处理技术
检索系统
像素点
系统为您推荐了相关专利信息
自定义表单
校验规则
校验特征
纠错模式
校验系统
图像生成方法
文本
图像生成程序
分词
生成高分辨率
Delaunay三角网
建筑物
语义特征
数据
三角形