摘要
本发明涉及计算机视觉与多模态学习技术领域,尤其是一种跨模态伪标签引导的弱监督目标检测方法。本发明构建有标签源域数据集训练图像分类教师模型,并构建教师‑学生网络结构;对目标域图像的区域特征聚类,通过优化源域类别与目标域簇之间的分配代价,为各簇分配伪标签,构建伪标签池;在伪标签池上训练学生模型用于目标域图像的区域特征检测。本发明通过引入跨模态注意力机制,实现了源类别标签与目标域特征之间更精准的语义对齐;结构保持正则项提升了标签分配的稳定性;多轮伪标签置信学习进一步增强了模型的泛化能力。本发明可广泛应用于目标检测、跨域迁移学习和开放世界识别等任务,实现了高效且精准的弱监督目标检测。
技术关键词
样本
学生
跨模态
图像
教师
原型
网络结构
信息熵
文本编码器
标签类别
语义
计算机视觉
模型更新
注意力机制
图文
聚类
序列
系统为您推荐了相关专利信息
实景三维模型
大比例尺地形图
速率
深度分布图
基准面
屈光度检测方法
光学成像原理
瞳孔检测
注意力机制
屈光度检测设备
特征提取器
工况
样本
故障诊断方法
神经网络层结构