基于大语言模型的AI智能文档处理方法

正文

推荐专利

基于大语言模型的AI智能文档处理方法

申请号：CN202510744774

申请日期：2025-06-05

公开号：CN120653438A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及基于大语言模型的AI智能文档处理方法，包括接收原始文档输入，通过多模态特征提取模块获取文档的文本特征、视觉布局特征和语义结构特征；使用布局感知的注意力机制处理多模态特征，生成文档元素的关联矩阵；将提取的特征输入预训练的大语言模型，生成包含文档元素间关联关系的中间表示；根据任务需求动态选择处理路径，包括但不限于：文档分类、信息抽取、内容生成或问答响应。该基于大语言模型的AI智能文档处理方法，通过布局感知的注意力机制，在标准数据集上的实验表明表格结构识别F1‑score提升，跨页元素关联准确率大幅提升，视觉‑文本特征对齐损失降低，通过动态分块处理策略使得100页PDF文档处理时间大幅缩短，GPU内存占用峰值下降。

技术关键词

智能文档大语言模型布局特征注意力机制生成文档特征提取模块多模态特征文档分类元素子模块动态差分隐私机制视觉特征负载均衡算法负载均衡器文本编码器

系统为您推荐了相关专利信息

一种基于RISC-V向量扩展的LLM推理加速方法及装置

SIMD并行处理瓶颈性能分析工具硬件平台动态

一种基于检索词的实体检索方法及系统

实体检索方法构建知识图谱大语言模型关键词关系

基于人工智能技术的知识问答方法、系统和电子设备

音频声音传感器知识问答方法人工智能技术时域特征

用于动作规划的方法、装置、设备和存储介质

解码模型融合特征训练机器人编码动作规划方法

基于心电图信息的异常生物标志物预测方法及系统

生物标志物变压器结构变压器模块随机梯度下降预训练模型

基于大语言模型的AI智能文档处理方法

站点导航

APP 下载