摘要
本发明属于人工智能技术领域,涉及一种基基于多模态大模型的单证识别方法、系统、设备及介质,所述方法包括以下步骤:1)图像预处理:对用户输入的单证图像进行预处理;2)多模态大模型推理:基于预处理后的单证图像、配置好的JSON模版和提示词模板,由多模态大模型进行推理,得到JSON结果;3)OCR识别:使用OCR识别技术对用户输入的单证图像进行识别,获得OCR识别结果;4)校验:将所述OCR识别结果与所述JSON结果进行相似度比较,并基于相似度比较结果确定单证识别结果。其泛化性强,能够适应多种类型的单据,能够提供高效且准确的识别结果。
技术关键词
多模态
识别方法
OCR识别技术
图像
校验对象
模版
校验模块
人工智能技术
字段
模板
处理器
识别设备
识别系统
坐标
识别模块
可读存储介质
程序
单据
矫正