基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统

正文

推荐专利

申请号：CN202510650520

申请日期：2025-05-20

公开号：CN120765980A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统，包括采集若干目标检测图像，标记后建立数据集，将数据集输入到改进视觉骨干网络模型进行训练，得到训练好的改进视觉骨干网络模型，改进视觉骨干网络模型包括若干个依次堆叠的特征提取器和特征融合器，特征提取器采用分解的曼哈顿自注意力机制实现特征提取，特征融合器采用未分解的曼哈顿自注意力机制实现特征融合，将待检测图像输入到训练好的改进视觉骨干网络模型，识别待检测图像上的识别目标。本发明能够在不同阶段根据需求灵活地利用曼哈顿自注意力机制的特性，引入显式空间先验，计算成本较低，捕捉图像中的空间信息更强，能充分适应图像数据。

技术关键词

注意力机制特征提取器融合器网络图像识别视觉矩阵标记局部特征提取处理器图像采集模块数据指令识别模块可读存储介质电子设备指数

系统为您推荐了相关专利信息

用于事件传播预测的弱社交网络上的对比学习方法

学习方法多任务联合训练多层次关系社交网络结构

基于AI模型的角色捏脸方法、系统、电子设备和存储介质

生成虚拟形象图像人脸特征风格参数

基于对比学习的多模态虚假新闻监测方法

关键帧监测方法文本模态特征关键词

视频分析方法、装置、设备及存储介质

视频分析方法序列文本计算机执行指令多模态

基于EfficientNet与MbileNet的高频焊接焊料视觉分类判定方法

判定方法视觉焊料高频焊接工艺嵌入式实时控制

基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统

站点导航

APP 下载