一种基于多模态大模型的印章检测和识别方法及系统

AITNT
正文
推荐专利
一种基于多模态大模型的印章检测和识别方法及系统
申请号:CN202511448053
申请日期:2025-10-11
公开号:CN120913186A
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的印章检测和识别方法及系统,通过图像预处理模块对获取的文档图像数据进行尺寸标准化处理,生成符合多模态大模型输入规范的标准化图像;将标准化图像与结构化识别指令组合后输入经微调训练的多模态大模型进行端到端推理,输出符合JSON格式规范的识别结果字符串;通过对识别结果字符串解析提取每一印章对象的边界框坐标、类型标签、文字内容及文字识别置信度,并基于文字识别置信度进行分级决策处理,最终输出结构化识别结果。本发明显著提升了印章识别的准确率和自动化水平,确保了输出结果的规范性和可靠性,有效解决了复杂场景下印章识别精度低和输出非标准化的问题。
技术关键词
识别置信度 文档图像数据 印章 多模态 识别方法 格式 对象 强化学习算法 坐标 标签 在线增量学习 图像像素 指令 决策 模糊参数 推理机制 非标准化 解析算法
系统为您推荐了相关专利信息
1
一种多模态双向运动旋转压电马达
旋转压电马达 双向运动 预紧螺栓 振子 压电陶瓷片
2
极端场景的识别方法、装置、设备以及汽车
场景 视频特征提取 视频特征信息 计算机执行指令 对象
3
一种基于机器视觉的羽毛球的球路战术识别方法及系统
羽毛球 战术识别方法 策略数据库 坐标 像素点
4
动态核保方法、装置、及电子设备
核保方法 长短期记忆网络 时间卷积网络 多模态 动态
5
一种基于多模态感知融合的果蔬类腐坏智能监测装置及其方法
智能监测装置 果蔬类 气体检测模块 传感模块 模数转换模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号