摘要
本发明公开了一种基于CNN‑OCR的科技文档检索方法及系统,涉及特性预测技术领域,包括构建系统接收用户选定类别后导入的若干科技文档,依次自动建立文档、图片、识别三级数据库;接收用户输入的关键词、检索范围条件后,在对应数据库范围中检索匹配的所有页面;基于汉字识别程序,结合数据库中信息,对活动页面进行实时的段、行、字词匹配标注。本发明在普通性能计算机或高性能嵌入式计算平台即可搭建海量规模科技扫描文档的检索系统,可在中小规模企业实现应用;将扫描文档识别中最耗时的OCR过程前移至建库阶段,使得关键检索阶段的扫描时间降至秒级;系统具有良好扩展性和兼容性,提高检索效率。
技术关键词
科技文档检索方法
图片
汉字
关键词
字符识别
OpenCV算法
字词
程序
构建系统
印刷体
字母
文本
搜索文件
数据
页面更新
网络
列表
系统更新
系统为您推荐了相关专利信息
聊天内容推荐方法
产品推荐模块
客户
服务端
声纹识别技术
机器人交互方法
大语言模型
语义向量
记忆
关键词
算法模型
推理方法
图像像素
图像分割
深度学习图像处理技术