摘要
本发明公开了一种基于注意力机制的目标检测和图像增强方法,包括以下步骤:步骤1,制作文本框检测数据集,并根据文本框标注规则标注数据集中每张图片的文本框位置,数据集中包括不同光照强度、不同拍摄角度、不同文本形式的样本;步骤2,建立基于注意力机制的文本框检测模型,通过文本框检测模型进行目标检测得到文本框的位置;步骤3,检测到文本框的位置后,根据光照强度采用相应的图像增强算法对文本框进行局部增强,进行后续的文本识别。本发明通过建立一种基于注意力机制的目标检测模型实现了目标文本框的快速和稳定检测,还通过局部图像增强大大减轻了自然场景下图像成像条件复杂等因素对后续文本识别的影响。
技术关键词
注意力机制
图像增强方法
图像增强算法
文本识别
标注规则
亮度
输入模块
自然场景
处理器
数据
网络结构
颜色
通道
存储装置
可读存储介质
多尺度
系统为您推荐了相关专利信息
回声消除算法
对齐模块
降噪模型
状态检测功能
交叉注意力机制
大语言模型
LSTM模型
库存预测方法
集成电路
特征提取网络
长短期记忆网络
注意力机制
交易检测方法
数据
处理器
早期预警方法
监督学习模型
深度生成模型
时间序列特征
设施
入侵检测方法
网络流量数据
邻居
节点特征
多头注意力机制