摘要
本发明公开了一种基于大语言模型的复杂表格语义理解方法和装置,首先利用表格检测模型和表格结构识别模型对文档进行预处理,提取文档中表格的结构信息。然后通过大语言模型对复杂表格的结构进行重建,根据行列信息,构造出两棵树结构。在此基础上,通过预设规则对重构后的表格进行语义翻译,并由大语言模型筛选出最符合逻辑的句子,从而实现对复杂表格内容的深度理解和准确表达。本发明提供了一个处理复杂表格语义的新方法,提高了表格处理的效率和准确性,为数据挖掘、信息检索、智能问答等实际应用场景提供有价值的参考。
技术关键词
表格
语义理解方法
大语言模型
图片
语句
重构
图像处理技术
文本识别
合并单元格
表头
逻辑
树状结构
信息检索
图像像素
处理器
页面
可读存储介质
系统为您推荐了相关专利信息
数据智能分析方法
数据库表结构
智能分析装置
子模块
语句