基于视觉语言模型的印章识别方法、设备、介质和产品

AITNT
正文
推荐专利
基于视觉语言模型的印章识别方法、设备、介质和产品
申请号:CN202511155745
申请日期:2025-08-18
公开号:CN121033526A
公开日期:2025-11-28
类型:发明专利
摘要
本申请提供一种基于视觉语言模型的印章识别方法、设备、介质和产品,涉及金融科技领域以及大模型在金融科技领域的应用。该方法通过确定待识别图像内的多个印章图像块,对多个印章图像块进行特征提取,基于提取到的特征,确定对应的印章候选框,确定该印章候选框的类型信息以及提示词;进而将提示词以及多个印章图像块输入至视觉语言模型中,得到每个印章候选框对应的印章识别结果;该方法基于提取到的特征确定对应的印章候选框,且基于视觉信息和语言信息,来共同对印章进行识别,确保了印章识别准确度,也显著提升了金融场景中微小、模糊、遮挡或复杂背景下印章的检测和识别精度,解决了现有技术中存在的小目标信息丢失的难题。
技术关键词
图像块 印章识别方法 计算机执行指令 视觉 印章识别装置 语言分析 可读存储介质 金融 计算机程序产品 识别设备 处理器通信 原型 图像分割 存储器 坐标 模块
系统为您推荐了相关专利信息
1
一种焊接机器人焊缝跟踪与自适应控制方法
焊缝跟踪控制 模糊控制算法 视觉传感器 激光传感器 偏差
2
一种用于悬浮作业场景的水下机械臂晃动补偿控制方法
单目视觉传感器 水下机械臂 传感定位系统 补偿控制方法 坐标系
3
基于病害特征增强和图像分类模型的路面病害分析方法
病害路面 路面病害图像 病害特征 图像分类模型 分析方法
4
一种基于视觉提示的异构车路智能体协同认知计算方法
对齐模块 计算方法 注意力机制 异构 邻域
5
驾驶决策的生成方法、模型训练方法、装置、设备及存储介质
自主移动设备 数据处理模型 驾驶环境信息 运动状态信息 深度学习模型训练
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号