摘要
本发明公开了一种面向题库建设的高效文档版面分析方法、系统、设备及介质,适用于题库建设,分析方法步骤如下:扫描不同学科试卷、教材配套习题、书籍的文档图像,并预处理得到无倾斜的扫描文档图像;标注扫描文档图像中各元素的相对位置和类别标签得到文档数据集;采用文档数据集对文档版面目标检测模型进行训练;将待检测的图像输入到经过训练的文档版面目标检测模型中,检测包括题目、图形和表格在内的前景内容,并输出版面元素的识别结果。本发明在提升前景内容检测精度的同时,提高了文档版面目标检测模型的推理速度,实现了对不同学科试卷和教材习题中的各类元素的准确识别,为题库建设等应用提供了高效的解决方案。
技术关键词
文档版面分析方法
扫描文档图像
分支
多尺度信息
编码器特征
文档特征
特征提取网络
输出特征
标签
试卷
动态
执行存储器存储
注意力
数据
分析系统
图像识别模块
系统为您推荐了相关专利信息
策略
标识特征
生成规则
远程配置管理方法
决策树模型
大语言模型
代码覆盖率
监控数据库状态
语句
瓶颈