一种基于多模态大模型的发票识别方法、装置及设备

正文

推荐专利

申请号：CN202510875797

申请日期：2025-06-26

公开号：CN120808377A

公开日期：2025-10-17

类型：发明专利

摘要

本申请涉及图像处理技术领域，提供一种基于多模态大模型的发票识别方法、装置及设备，本申请实施例提供的基于多模态大模型的发票识别方法，通过多模态大模型生成待处理发票图像的全局语义描述，以及，利用多模态大模型对待处理发票图像执行区域实例分割，输出每个票据对应的独立票据子图像，并根据全局语义描述和预设结构化模板构建多模态引导指令，然后将独立票据子图像及对应引导指令输入多模态大模型，获得发票信息结构化数据，发票信息结构化数据可直接满足预设要求。且通过光学字符识别模型提取的刚性文本特征，对发票信息结构化数据进行矫正，在保留多模态大模型全局推理优势的同时，进一步提高发票信息结构化数据的准确性。

技术关键词

发票识别方法多模态票据字形特征置信度阈值文本图像发票识别装置光学字符识别实例分割语义数据生成发票矫正大语言模型指令通信接口关系

系统为您推荐了相关专利信息

一种智能家居远程调控预警方法及系统

智能家电功率传感器电压传感器历史维修记录电流传感器

一种车内活体检测方法及系统、计算机设备及介质

活体检测方法氧气传感器车辆控制模块湿度传感器闭锁

用于提供答复的方法、装置、设备、介质及程序产品

交互组件地图元素多模态地点文本

多模态波浪推进无人航行器

浮力调节系统多模态压载水舱水翼推进系统

一种用于票据识别的数据处理方法、系统及存储介质

数据处理方法拓扑特征多光谱信息熵权重特征融合

一种基于多模态大模型的发票识别方法、装置及设备

站点导航

APP 下载