基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统

AITNT
正文
推荐专利
基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统
申请号:CN202510650520
申请日期:2025-05-20
公开号:CN120765980A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统,包括采集若干目标检测图像,标记后建立数据集,将数据集输入到改进视觉骨干网络模型进行训练,得到训练好的改进视觉骨干网络模型,改进视觉骨干网络模型包括若干个依次堆叠的特征提取器和特征融合器,特征提取器采用分解的曼哈顿自注意力机制实现特征提取,特征融合器采用未分解的曼哈顿自注意力机制实现特征融合,将待检测图像输入到训练好的改进视觉骨干网络模型,识别待检测图像上的识别目标。本发明能够在不同阶段根据需求灵活地利用曼哈顿自注意力机制的特性,引入显式空间先验,计算成本较低,捕捉图像中的空间信息更强,能充分适应图像数据。
技术关键词
注意力机制 特征提取器 融合器 网络图像识别 视觉 矩阵 标记 局部特征提取 处理器 图像采集模块 数据 指令 识别模块 可读存储介质 电子设备 指数
系统为您推荐了相关专利信息
1
用于事件传播预测的弱社交网络上的对比学习方法
学习方法 多任务联合训练 多层次 关系 社交网络结构
2
基于AI模型的角色捏脸方法、系统、电子设备和存储介质
生成虚拟形象 图像 人脸特征 风格 参数
3
基于对比学习的多模态虚假新闻监测方法
关键帧 监测方法 文本 模态特征 关键词
4
视频分析方法、装置、设备及存储介质
视频分析方法 序列 文本 计算机执行指令 多模态
5
基于EfficientNet与MbileNet的高频焊接焊料视觉分类判定方法
判定方法 视觉 焊料 高频焊接工艺 嵌入式实时控制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号