摘要
本发明公开了一种基于知识增强的光学图像零样本目标检测方法,包括:构造数据集并拆分为可见类和不可见类图像;将可见类图像输入ResNet‑50网络,提取图像特征并使用RPN网络处理,得到待测区域特征和对应待测边界框坐标,使用RoI Align操作处理待测区域特征得到视觉特征;使用回归器结构计算边界框坐标和待测边界框坐标的损失,得到适合待测目标的边界框;改进分类器,并对可见类图像进行目标分类,计算预测目标分类与真实目标分类的损失函数,对分类器进行训练;使用以上结构对不可见类图像进行目标检测得到识别的目标;本方案减轻了语义鸿沟问题对于检测的不利影响;进行知识增强增加对不可见类图像的检测能力,提高预测的精度。
技术关键词
语义特征
视觉特征
对齐模块
图像
分类器
节点
网络
消息
坐标
双曲正切函数
同义词
语义向量
样本
门控循环单元
数据
关系
代表
对象
系统为您推荐了相关专利信息
机器人控制系统
深度相机
机器人行进路径
机器人控制方法
风险
X线胸片
PICC导管
ResNet网络
文本
导管定位