一种基于多模态大语言模型的数据处理方法及系统

正文

推荐专利

申请号：CN202410818202

申请日期：2024-06-24

公开号：CN118377852B

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开一种基于多模态大语言模型的数据处理方法及系统，涉及数据处理技术领域。所述方法包括：获取非结构化文档输入，对非结构化文档中每个页面进行解析，得到页面模态数据集合；使用多模态模型对页面中的多种模态数据进行元素综合分析；计算每个页面元素分析结果的可信度；对可信度低于阈值的页面结构，调整多模态模型参数进行模型纠错，继续对可信度低于阈值的页面进行元素综合分析，直至可信度不低于阈值；分析每个页面结构中各元素的排布，生成结构化文档。本发明利用多模态语言模型提高了非结构化文档的处理准确性，还通过内置的自我纠错机制，有效地减少了错误的传递和累积，从而提高了数据处理的整体效率和质量。

技术关键词

大语言模型页面特征多模态非结构化文档页面结构数据处理方法元素数据处理系统文档生成模块纠错机制纠错模块数据处理技术分析模块参数

系统为您推荐了相关专利信息

一种基于Mamba与注意力机制的多模态图像融合方法

图像融合方法多模态特征融合注意力机制 Hessian矩阵金字塔

基于图神经网络和大语言模型的数据问答方法及系统

语句大语言模型生成提示信息问答方法节点

一种多模态数据驱动的盆底损伤智能监测方法及系统

智能监测方法盆底加权特征融合特征文本

基于稀疏实例引导的高效多模态融合检测方法及装置

融合检测方法点云特征深度分布特征相机图像数据融合特征

一种基于多源信息融合的电动汽车停车场所火灾防控系统

多源信息融合火灾防控方法火灾风险评估停车场火灾防控系统

一种基于多模态大语言模型的数据处理方法及系统

站点导航

APP 下载