摘要
本发明公开了一种基于文本引导的机械工具图像目标检测方法。方法包括使用相机拍摄采集机械工具图片,并针对每张机械工具图片建立文本信息,每张机械工具图片与对应的文本信息形成图像文本对,所有的图像文本对形成机械工具数据集,然后构建文本目标检测模型,将机械工具数据集输入到文本目标检测模型中进行训练,得到训练好的文本目标检测模型,最后分别获取待测机械工具图片和对应的文本信息,将待测机械工具图片和对应的文本信息输入到训练好的文本目标检测模型中进行检测,得到机械工具检测结果。本发明通过设计更高效的文本视觉融合策略与特征提取网络,有效提升了目标检测精度,在场景改变时依然具有良好的目标识别泛化能力。
技术关键词
空间特征提取
机械工具
文本
嵌入特征
注意力机制
视觉检测模块
图像
图片
输入端
瓶颈
特征提取网络
预训练模型
融合策略
数据
输出端
相机
场景
系统为您推荐了相关专利信息
图像去雾方法
训练深度估计模型
大气散射模型
生成对抗网络
去雾图像
电力需求预测方法
变量
移动通讯基站设备
多头注意力机制
加权特征
静脉血栓栓塞
回归预测模型
风险预测方法
逻辑回归模型
逻辑回归方法