一种文档信息结构化抽取方法、装置、存储介质及设备

正文

推荐专利

申请号：CN202411891668

申请日期：2024-12-20

公开号：CN119763139A

公开日期：2025-04-04

类型：发明专利

摘要

本申请公开了一种文档信息结构化抽取方法、装置、存储介质及设备，该方法包括：首先获取目标文档所在的目标图像；并提取目标图像的目标视觉特征；然后将目标视觉特征输入语义信息提取模型进行OCR信息提取，得到目标OCR信息，并对其进行编码处理，得到目标语义编码向量；接着将目标视觉特征和目标语义编码向量输入预先构建的多模态大语言模型，预测得到目标文档对应的信息结构化抽取结果。可见，由于本申请采用的是结合OCR信息与多模态大语言模型的通用信息结构化抽取方法，并采用了视觉特征和OCR信息分别作为空间和文本语义上的抽取依据，解决了通过纯文本进行结构化抽取时的空间信息匮乏问题，从而能够有效提高文档信息结构化抽取的准确率。

技术关键词

语义信息提取视觉特征大语言模型光学字符识别图像多模态可读存储介质终端设备抽取设备抽取装置处理器样本存储器指令编码文本计算机程序坐标

系统为您推荐了相关专利信息

一种基于RK3588的智能枪柜管理系统

智能枪柜管理系统远程管理终端特征识别模块嵌入式Linux系统环境监测模块

基于多光谱融合的光伏板热斑红外识别方法、装置及设备

可见光区域多光谱可见光图像识别方法光伏板

一种图像的分类方法、装置及相关设备

编码器多头注意力机制图像块图像分类模型图像分割

一种眼科患者术后康复智能监护系统

智能监护系统患者术后康复神经网络模型图像处理服务器文本

一种应用短视频一键成片的视频分镜方法及系统

颜色直方图特征 HSV颜色直方图短视频节点特征提取模块

一种文档信息结构化抽取方法、装置、存储介质及设备

站点导航

APP 下载