基于视觉语言模型的印章识别方法、设备、介质和产品

正文

推荐专利

申请号：CN202511155745

申请日期：2025-08-18

公开号：CN121033526A

公开日期：2025-11-28

类型：发明专利

摘要

本申请提供一种基于视觉语言模型的印章识别方法、设备、介质和产品，涉及金融科技领域以及大模型在金融科技领域的应用。该方法通过确定待识别图像内的多个印章图像块，对多个印章图像块进行特征提取，基于提取到的特征，确定对应的印章候选框，确定该印章候选框的类型信息以及提示词；进而将提示词以及多个印章图像块输入至视觉语言模型中，得到每个印章候选框对应的印章识别结果；该方法基于提取到的特征确定对应的印章候选框，且基于视觉信息和语言信息，来共同对印章进行识别，确保了印章识别准确度，也显著提升了金融场景中微小、模糊、遮挡或复杂背景下印章的检测和识别精度，解决了现有技术中存在的小目标信息丢失的难题。

技术关键词

图像块印章识别方法计算机执行指令视觉印章识别装置语言分析可读存储介质金融计算机程序产品识别设备处理器通信原型图像分割存储器坐标模块

系统为您推荐了相关专利信息

一种焊接机器人焊缝跟踪与自适应控制方法

焊缝跟踪控制模糊控制算法视觉传感器激光传感器偏差

一种用于悬浮作业场景的水下机械臂晃动补偿控制方法

单目视觉传感器水下机械臂传感定位系统补偿控制方法坐标系

基于病害特征增强和图像分类模型的路面病害分析方法

病害路面路面病害图像病害特征图像分类模型分析方法

一种基于视觉提示的异构车路智能体协同认知计算方法

对齐模块计算方法注意力机制异构邻域

驾驶决策的生成方法、模型训练方法、装置、设备及存储介质

自主移动设备数据处理模型驾驶环境信息运动状态信息深度学习模型训练

基于视觉语言模型的印章识别方法、设备、介质和产品

站点导航

APP 下载