一种基于注意力机制的目标检测和图像增强方法

正文

推荐专利

申请号：CN202410864369

申请日期：2024-06-30

公开号：CN118736587A

公开日期：2024-10-01

类型：发明专利

摘要

本发明公开了一种基于注意力机制的目标检测和图像增强方法，包括以下步骤：步骤1，制作文本框检测数据集，并根据文本框标注规则标注数据集中每张图片的文本框位置，数据集中包括不同光照强度、不同拍摄角度、不同文本形式的样本；步骤2，建立基于注意力机制的文本框检测模型，通过文本框检测模型进行目标检测得到文本框的位置；步骤3，检测到文本框的位置后，根据光照强度采用相应的图像增强算法对文本框进行局部增强，进行后续的文本识别。本发明通过建立一种基于注意力机制的目标检测模型实现了目标文本框的快速和稳定检测，还通过局部图像增强大大减轻了自然场景下图像成像条件复杂等因素对后续文本识别的影响。

技术关键词

注意力机制图像增强方法图像增强算法文本识别标注规则亮度输入模块自然场景处理器数据网络结构颜色通道存储装置可读存储介质多尺度

系统为您推荐了相关专利信息

一种回声消除算法

回声消除算法对齐模块降噪模型状态检测功能交叉注意力机制

一种基于时间提示增强的大语言模型的集成电路物料库存预测方法和系统

大语言模型 LSTM模型库存预测方法集成电路特征提取网络

异常交易检测方法及装置

长短期记忆网络注意力机制交易检测方法数据处理器

基于大数据分析的污染设施异常排放早期预警方法

早期预警方法监督学习模型深度生成模型时间序列特征设施

一种结合GAN与GNN的网络流量异常入侵检测方法及系统

入侵检测方法网络流量数据邻居节点特征多头注意力机制

一种基于注意力机制的目标检测和图像增强方法

站点导航

APP 下载