摘要
本发明提供一种基于OCR多模态大模型的表格数据提取方法,包括数据载体获取与表格数据判断;图片格式表格的OCR识别;构建大模型Prompt语句;图片格式表格的语言大模型处理;图片格式表格的多模态处理;确定非图片格式的数据载体中表格数据对应的json数据结构;结果比对与模式选择;模型优化执行和领域字典更新;模型与字典集成测试;系统性能监控与自适应调整。本发明克服了现有技术中格式专一性的问题,增强了工具对不同领域表格数据的适应性,能够使系统随着处理数据量的增加不断提升性能。
技术关键词
表格数据提取方法
数据载体
表头
分析页面
修正字典
定位文字区域
图形绘制功能
图片
语义
语句
系统性能监控
分析数据特征
文本
样式
视觉
数据格式