摘要
本发明提供了一种基于LLMs大语言模型的半结构化文件的处理方法,用于对半结构化文件进行高效解析及结构化文件转换,属于智能文档处理与多模态学习技术领域。本发明的创新如下:多模态融合解析:采用分层跨模态注意力机制HCMA,结合多头注意力机制与图神经网络GNN,实现文本与图像的多层次特征融合;自适应结构化转换:采用动态结构解析网络DPN,结合强化学习与生成模型,实现文档结构的自适应解析;生成模型与多模态推理:采用多模态生成推理网络MGRN,结合扩散模型与神经符号推理,实现文本与图像的联合生成与推理。本发明在文档解析、信息提取和智能推理方面带来了显著的技术突破,为各行业的数据驱动创新提供了有力支持。
技术关键词
文本生成器
多头注意力机制
多层次特征融合
多模态
双向注意力机制
图像生成器
推理网络
策略
语义
文件转换方法
分布式计算技术
高层次
动态滑动窗口
特征金字塔网络
多尺度特征融合