摘要
本申请公开了一种题目区域识别方法及相关装置,涉及图片处理技术领域,题目区域识别方法包括:获取包含若干题目的目标图片;对目标图片进行文本识别,得到目标图片中每个文本行的文本内容和位置信息;利用大语言模型,根据每个文本行的文本内容和/或目标图片,生成每个题目的文本内容;通过将每个文本行的文本内容与每个题目的文本内容进行匹配,来获得属于每个题目的文本行;根据属于每个题目的文本行的位置信息,确定目标图片中每个题目所在的区域。本申请提供的题目区域识别方法简单高效,且识别效果较好。
技术关键词
区域识别方法
图片
大语言模型
文本行
文本识别
计算机可读指令
电子设备
区域识别装置
匹配模块
计算机存储介质
存储计算机程序
计算机程序产品
坐标
处理器
矩形
顶点
多模态
列表
系统为您推荐了相关专利信息
油箱区域
预训练模型
管状物体
空间特征提取
加油站台
泛化方法
图像特征提取
匹配模块
样本
文本特征向量