一种基于图神经网络增强语言模型的富视觉文档信息抽取方法

AITNT
正文
推荐专利
一种基于图神经网络增强语言模型的富视觉文档信息抽取方法
申请号:CN202411545208
申请日期:2024-10-31
公开号:CN119599017A
公开日期:2025-03-11
类型:发明专利
摘要
在文档信息抽取方面,文档预训练模型成为主流,然而受限于大模型预训练的时间及计算资源开销,文档细粒度信息无法注入大模型中,长距离结构信息易被忽略,然而想要从根本上改进预训练模型是困难的。因此我们提出了一种基于图神经网络增强语言模型的富视觉文档信息抽取方法,该方法使用图神经网络增强预训练模型的文档的重建能力,将文档的视觉、文本以及结构输入图神经网络,然后将图神经网络与预训练模型的输出进行融合微调,能够进一步补充预训练模型欠缺的知识,可以有效的提高下游任务的表现。该框架为轻量级增强方案,不增加太多计算负担,能够广泛适用多种预训练模型,为文档信息抽取技术带来新突破。
技术关键词
预训练模型 信息抽取方法 多模态特征 注意力机制 布局特征 输出特征 神经网络模型 模块 实体 信息抽取技术 视觉特征 融合特征 模型预训练 多模态信息 解析技术 特征提取器 文本识别
系统为您推荐了相关专利信息
1
一种农业机器人控制方法、装置、设备及存储介质
农业机器人 农田环境 语义分割模型 图像采集设备 坐标系
2
变压器的缺陷检测方法、装置、电子设备及存储介质
Sigmoid函数 深度学习模型 缺陷检测方法 注意力机制 补丁信息
3
多频段声呐协同的复杂环境目标精准识别系统
回波 频段 识别系统 特征提取单元 图像
4
一种基于图神经网络的配电网多资源融合规划方法及系统
数字孪生模型 分层强化学习 交直流混合系统 资源 计算机可执行指令
5
基于Camera-LiDAR信息融合的智能移动机器人位置识别方法、装置、设备和介质
激光雷达点云 鸟瞰图像 距离图像 模态特征 智能移动机器人
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号