基于多模态大模型的单证识别方法、系统、设备及介质

AITNT
正文
推荐专利
基于多模态大模型的单证识别方法、系统、设备及介质
申请号:CN202510444829
申请日期:2025-04-10
公开号:CN120340054A
公开日期:2025-07-18
类型:发明专利
摘要
本发明属于人工智能技术领域,涉及一种基基于多模态大模型的单证识别方法、系统、设备及介质,所述方法包括以下步骤:1)图像预处理:对用户输入的单证图像进行预处理;2)多模态大模型推理:基于预处理后的单证图像、配置好的JSON模版和提示词模板,由多模态大模型进行推理,得到JSON结果;3)OCR识别:使用OCR识别技术对用户输入的单证图像进行识别,获得OCR识别结果;4)校验:将所述OCR识别结果与所述JSON结果进行相似度比较,并基于相似度比较结果确定单证识别结果。其泛化性强,能够适应多种类型的单据,能够提供高效且准确的识别结果。
技术关键词
多模态 识别方法 OCR识别技术 图像 校验对象 模版 校验模块 人工智能技术 字段 模板 处理器 识别设备 识别系统 坐标 识别模块 可读存储介质 程序 单据 矫正
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号