摘要
本申请提供一种视觉富文档信息抽取方法、装置、设备、介质及程序产品。涉及文本信息抽取技术领域。该方法包括:获取待处理的视觉富文档,确定所述视觉富文档中包含的至少一组文本信息;采用训练好的信息抽取模型对各所述文本信息进行信息抽取,得到所述视觉富文档的抽取结果;其中,所述信息抽取模型基于预设神经网络结构以及对训练完成的初始信息抽取模型进行蒸馏后的网络结构所构建。本申请的方法,解决了系统进行文本信息抽取过程中处理压力大的技术问题,通过对训练好的初始模型进行轻量化处理,达到在尽可能保持准确度的同时,大幅缩小模型尺寸,降低系统的数据处理压力,实现降低系统的计算资源成本运维成本。
技术关键词
信息抽取模型
信息抽取方法
编码模块
文本
神经网络结构
计算机执行指令
视觉
长短记忆网络
蒸馏
多模态
信息抽取技术
解码模块
输出特征
可读存储介质
抽取装置
处理器
注意力