摘要
本发明公开了PDF文档中图像与内容关联的智能检索方法及系统,涉及数据处理技术领域,该方法包括:调取文档预处理策略对PDF文档进行预处理,得到图像处理结果和内容处理结果;根据关联索引机制对图像处理结果和内容处理结果进行关联分析,得到图文索引结构;以图文索引结构为基准对PDF文档的目标检索请求进行检索匹配,得到目标检索信息。本发明解决了现有PDF文档的检索方法无法有效关联图像与文本内容,导致检索效率和准确性不足的技术问题,达到了通过构建图文索引结构,实现图像与文本内容的智能关联检索,提高检索效率和准确性的技术效果。
技术关键词
智能检索方法
索引机制
图像处理
图文
对象
策略
语义向量
智能检索系统
分类器
汉明距离
标签
文本
语义特征
匹配模块
离散余弦变换
分析模块
场景
数据处理技术