视觉富文档信息抽取方法、装置、设备、介质及程序产品

正文

推荐专利

申请号：CN202411695870

申请日期：2024-11-25

公开号：CN119940353A

公开日期：2025-05-06

类型：发明专利

摘要

本申请提供一种视觉富文档信息抽取方法、装置、设备、介质及程序产品。涉及文本信息抽取技术领域。该方法包括：获取待处理的视觉富文档，确定所述视觉富文档中包含的至少一组文本信息；采用训练好的信息抽取模型对各所述文本信息进行信息抽取，得到所述视觉富文档的抽取结果；其中，所述信息抽取模型基于预设神经网络结构以及对训练完成的初始信息抽取模型进行蒸馏后的网络结构所构建。本申请的方法，解决了系统进行文本信息抽取过程中处理压力大的技术问题，通过对训练好的初始模型进行轻量化处理，达到在尽可能保持准确度的同时，大幅缩小模型尺寸，降低系统的数据处理压力，实现降低系统的计算资源成本运维成本。

技术关键词

信息抽取模型信息抽取方法编码模块文本神经网络结构计算机执行指令视觉长短记忆网络蒸馏多模态信息抽取技术解码模块输出特征可读存储介质抽取装置处理器注意力

视觉富文档信息抽取方法、装置、设备、介质及程序产品

站点导航

APP 下载