基于大语言模型的AI智能文档处理方法

AITNT
正文
推荐专利
基于大语言模型的AI智能文档处理方法
申请号:CN202510744774
申请日期:2025-06-05
公开号:CN120653438A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及基于大语言模型的AI智能文档处理方法,包括接收原始文档输入,通过多模态特征提取模块获取文档的文本特征、视觉布局特征和语义结构特征;使用布局感知的注意力机制处理多模态特征,生成文档元素的关联矩阵;将提取的特征输入预训练的大语言模型,生成包含文档元素间关联关系的中间表示;根据任务需求动态选择处理路径,包括但不限于:文档分类、信息抽取、内容生成或问答响应。该基于大语言模型的AI智能文档处理方法,通过布局感知的注意力机制,在标准数据集上的实验表明表格结构识别F1‑score提升,跨页元素关联准确率大幅提升,视觉‑文本特征对齐损失降低,通过动态分块处理策略使得100页PDF文档处理时间大幅缩短,GPU内存占用峰值下降。
技术关键词
智能文档 大语言模型 布局特征 注意力机制 生成文档 特征提取模块 多模态特征 文档分类 元素 子模块 动态 差分隐私机制 视觉特征 负载均衡算法 负载均衡器 文本编码器
系统为您推荐了相关专利信息
1
一种基于RISC-V向量扩展的LLM推理加速方法及装置
SIMD并行处理 瓶颈 性能分析工具 硬件平台 动态
2
一种基于检索词的实体检索方法及系统
实体检索方法 构建知识图谱 大语言模型 关键词 关系
3
基于人工智能技术的知识问答方法、系统和电子设备
音频 声音传感器 知识问答方法 人工智能技术 时域特征
4
用于动作规划的方法、装置、设备和存储介质
解码模型 融合特征 训练机器人 编码 动作规划方法
5
基于心电图信息的异常生物标志物预测方法及系统
生物标志物 变压器结构 变压器模块 随机梯度下降 预训练模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号