摘要
本发明公开一种基于多模态大语言模型的数据处理方法及系统,涉及数据处理技术领域。所述方法包括:获取非结构化文档输入,对非结构化文档中每个页面进行解析,得到页面模态数据集合;使用多模态模型对页面中的多种模态数据进行元素综合分析;计算每个页面元素分析结果的可信度;对可信度低于阈值的页面结构,调整多模态模型参数进行模型纠错,继续对可信度低于阈值的页面进行元素综合分析,直至可信度不低于阈值;分析每个页面结构中各元素的排布,生成结构化文档。本发明利用多模态语言模型提高了非结构化文档的处理准确性,还通过内置的自我纠错机制,有效地减少了错误的传递和累积,从而提高了数据处理的整体效率和质量。
技术关键词
大语言模型
页面特征
多模态
非结构化文档
页面结构
数据处理方法
元素
数据处理系统
文档生成模块
纠错机制
纠错模块
数据处理技术
分析模块
参数
系统为您推荐了相关专利信息
图像融合方法
多模态特征融合
注意力机制
Hessian矩阵
金字塔
融合检测方法
点云特征
深度分布特征
相机图像数据
融合特征
多源信息融合
火灾防控方法
火灾风险评估
停车场
火灾防控系统