基于多模态与OCR模型融合的票据凭证信息提取方法、系统和设备

AITNT
正文
推荐专利
基于多模态与OCR模型融合的票据凭证信息提取方法、系统和设备
申请号:CN202510673056
申请日期:2025-05-23
公开号:CN120976947A
公开日期:2025-11-18
类型:发明专利
摘要
本发明涉及基于多模态与OCR模型融合的票据凭证信息提取方法:S1获取票据凭证的图像;S2对图像进行预处理;S3使用OCR引擎对预处理后的图像进行识别,得到每个文本块的文字内容和对应的二维坐标;S4将识别得到的文本片段和原始图像作为输入,使用预训练的多模态模型进行联合编码,模型评估并输出每段文本与预定义字段类别的匹配度,确定各字段的候选文本及其置信度;S5对关键字段进行精确定位和提取并校验OCR输出与语义结果的一致性;S6若校验结果冲突或某字段置识别信度低于阈值,则进行纠错操作;S7输出结构化的票据凭证信息。本发明通过多模态融合和迭代校正,有效降低了非标凭证信息抽取的错误率,适用于多种凭证格式和复杂场景。
技术关键词
信息提取方法 多模态 凭证 票据 文本 关键字 信息提取系统 视觉特征提取 图像获取模块 纠错模块 语义向量 校验模块 电子设备 边缘检测 处理器通信 校正 格式
系统为您推荐了相关专利信息
1
机器学习驱动的多模态激光稳频误差反馈校正系统
反馈校正系统 激光稳频 机器学习驱动 多模态数据采集 非线性降维算法
2
酒曲曲心理化值检测模型建立、训练及检测方法
检测模型建立方法 心理 酒曲 曲粉 检测模型训练方法
3
基于大模型的在线合同风险评估方法、系统、介质和设备
风险评估方法 合同文本数据 风险点 风险评估规则 风险评估报告
4
证件防伪检测中的材质真伪检测方法和装置
多模态 分支 网络 频域特征 融合特征
5
基于云平台的特殊儿童运动干预信息交互方法及系统
信息交互方法 动作规范 加密数据 云平台 儿童
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号