摘要
本发明实施例公开了一种基于多模型融合的表格处理系统及方法,所述系统包括多模态大模型、文本大模型、表格识别模型,其中,多模态大模型将输入表格图像与提示词转换为LaTeX格式的表格文本,并输入给文本大模型;表格识别模型在遇到长表格识别出现问题时,对长表格的重新识别和处理,得到对应的表格文本并输入文本大模型;文本大模型挖掘表格文本中的语义信息,理解表格中各个数据项之间的关系以及表格所表达的整体含义,并作出相应的回答。本发明利能够更精准地将表格图像转换为LaTeX格式的表格文本,再进行表格理解问答,有效减少了转换错误和格式混乱的情况并提升了表格理解的准确性和稳定性。
技术关键词
表格
多模型
文本
多模态
合并单元格
数据项
视觉特征
基础结构
数据分布
格式
语义
关系
图像
多阶段
布局
策略
颜色
场景
系统为您推荐了相关专利信息
风险评估方法
血流
多模态融合机制
医学特征
时序分析方法
专家推荐方法
文本特征分析
算术平均值
图谱
专家推荐系统
多模态生物特征
生物特征认证方法
注意力
生物特征信息
生物特征认证装置