一种基于文本引导的机械工具图像目标检测方法

正文

推荐专利

申请号：CN202510193626

申请日期：2025-02-21

公开号：CN120125804A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于文本引导的机械工具图像目标检测方法。方法包括使用相机拍摄采集机械工具图片，并针对每张机械工具图片建立文本信息，每张机械工具图片与对应的文本信息形成图像文本对，所有的图像文本对形成机械工具数据集，然后构建文本目标检测模型，将机械工具数据集输入到文本目标检测模型中进行训练，得到训练好的文本目标检测模型，最后分别获取待测机械工具图片和对应的文本信息，将待测机械工具图片和对应的文本信息输入到训练好的文本目标检测模型中进行检测，得到机械工具检测结果。本发明通过设计更高效的文本视觉融合策略与特征提取网络，有效提升了目标检测精度，在场景改变时依然具有良好的目标识别泛化能力。

技术关键词

空间特征提取机械工具文本嵌入特征注意力机制视觉检测模块图像图片输入端瓶颈特征提取网络预训练模型融合策略数据输出端相机场景

系统为您推荐了相关专利信息

一种金融模型评估方法、装置、设备及存储介质

模型评估方法金融文本图片样本

一种基于雾天气深度估计的图像去雾方法及系统

图像去雾方法训练深度估计模型大气散射模型生成对抗网络去雾图像

融合对抗增强与因果感知机制的电力需求预测方法及系统

电力需求预测方法变量移动通讯基站设备多头注意力机制加权特征

肺癌患者静脉血栓栓塞风险预测系统、方法、终端及介质

静脉血栓栓塞回归预测模型风险预测方法逻辑回归模型逻辑回归方法

双录签名的校验方法、装置、计算机设备及存储介质

校验模型校验方法节点人脸特征客户端

一种基于文本引导的机械工具图像目标检测方法

站点导航

APP 下载