摘要
本发明公开了一种基于多模态大模型的印章检测和识别方法及系统,通过图像预处理模块对获取的文档图像数据进行尺寸标准化处理,生成符合多模态大模型输入规范的标准化图像;将标准化图像与结构化识别指令组合后输入经微调训练的多模态大模型进行端到端推理,输出符合JSON格式规范的识别结果字符串;通过对识别结果字符串解析提取每一印章对象的边界框坐标、类型标签、文字内容及文字识别置信度,并基于文字识别置信度进行分级决策处理,最终输出结构化识别结果。本发明显著提升了印章识别的准确率和自动化水平,确保了输出结果的规范性和可靠性,有效解决了复杂场景下印章识别精度低和输出非标准化的问题。
技术关键词
识别置信度
文档图像数据
印章
多模态
识别方法
格式
对象
强化学习算法
坐标
标签
在线增量学习
图像像素
指令
决策
模糊参数
推理机制
非标准化
解析算法
系统为您推荐了相关专利信息
旋转压电马达
双向运动
预紧螺栓
振子
压电陶瓷片
场景
视频特征提取
视频特征信息
计算机执行指令
对象
核保方法
长短期记忆网络
时间卷积网络
多模态
动态
智能监测装置
果蔬类
气体检测模块
传感模块
模数转换模块