摘要
在文档信息抽取方面,文档预训练模型成为主流,然而受限于大模型预训练的时间及计算资源开销,文档细粒度信息无法注入大模型中,长距离结构信息易被忽略,然而想要从根本上改进预训练模型是困难的。因此我们提出了一种基于图神经网络增强语言模型的富视觉文档信息抽取方法,该方法使用图神经网络增强预训练模型的文档的重建能力,将文档的视觉、文本以及结构输入图神经网络,然后将图神经网络与预训练模型的输出进行融合微调,能够进一步补充预训练模型欠缺的知识,可以有效的提高下游任务的表现。该框架为轻量级增强方案,不增加太多计算负担,能够广泛适用多种预训练模型,为文档信息抽取技术带来新突破。
技术关键词
预训练模型
信息抽取方法
多模态特征
注意力机制
布局特征
输出特征
神经网络模型
模块
实体
信息抽取技术
视觉特征
融合特征
模型预训练
多模态信息
解析技术
特征提取器
文本识别
系统为您推荐了相关专利信息
农业机器人
农田环境
语义分割模型
图像采集设备
坐标系
Sigmoid函数
深度学习模型
缺陷检测方法
注意力机制
补丁信息
数字孪生模型
分层强化学习
交直流混合系统
资源
计算机可执行指令
激光雷达点云
鸟瞰图像
距离图像
模态特征
智能移动机器人