基于多模态与OCR模型融合的票据凭证信息提取方法、系统和设备

正文

推荐专利

申请号：CN202510673056

申请日期：2025-05-23

公开号：CN120976947A

公开日期：2025-11-18

类型：发明专利

摘要

本发明涉及基于多模态与OCR模型融合的票据凭证信息提取方法：S1获取票据凭证的图像；S2对图像进行预处理；S3使用OCR引擎对预处理后的图像进行识别，得到每个文本块的文字内容和对应的二维坐标；S4将识别得到的文本片段和原始图像作为输入，使用预训练的多模态模型进行联合编码，模型评估并输出每段文本与预定义字段类别的匹配度，确定各字段的候选文本及其置信度；S5对关键字段进行精确定位和提取并校验OCR输出与语义结果的一致性；S6若校验结果冲突或某字段置识别信度低于阈值，则进行纠错操作；S7输出结构化的票据凭证信息。本发明通过多模态融合和迭代校正，有效降低了非标凭证信息抽取的错误率，适用于多种凭证格式和复杂场景。

技术关键词

信息提取方法多模态凭证票据文本关键字信息提取系统视觉特征提取图像获取模块纠错模块语义向量校验模块电子设备边缘检测处理器通信校正格式

系统为您推荐了相关专利信息

机器学习驱动的多模态激光稳频误差反馈校正系统

反馈校正系统激光稳频机器学习驱动多模态数据采集非线性降维算法

酒曲曲心理化值检测模型建立、训练及检测方法

检测模型建立方法心理酒曲曲粉检测模型训练方法

基于大模型的在线合同风险评估方法、系统、介质和设备

风险评估方法合同文本数据风险点风险评估规则风险评估报告

证件防伪检测中的材质真伪检测方法和装置

多模态分支网络频域特征融合特征

基于云平台的特殊儿童运动干预信息交互方法及系统

信息交互方法动作规范加密数据云平台儿童

基于多模态与OCR模型融合的票据凭证信息提取方法、系统和设备

站点导航

APP 下载