一种基于文本引导的机械工具图像目标检测方法

AITNT
正文
推荐专利
一种基于文本引导的机械工具图像目标检测方法
申请号:CN202510193626
申请日期:2025-02-21
公开号:CN120125804A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种基于文本引导的机械工具图像目标检测方法。方法包括使用相机拍摄采集机械工具图片,并针对每张机械工具图片建立文本信息,每张机械工具图片与对应的文本信息形成图像文本对,所有的图像文本对形成机械工具数据集,然后构建文本目标检测模型,将机械工具数据集输入到文本目标检测模型中进行训练,得到训练好的文本目标检测模型,最后分别获取待测机械工具图片和对应的文本信息,将待测机械工具图片和对应的文本信息输入到训练好的文本目标检测模型中进行检测,得到机械工具检测结果。本发明通过设计更高效的文本视觉融合策略与特征提取网络,有效提升了目标检测精度,在场景改变时依然具有良好的目标识别泛化能力。
技术关键词
空间特征提取 机械工具 文本 嵌入特征 注意力机制 视觉检测模块 图像 图片 输入端 瓶颈 特征提取网络 预训练模型 融合策略 数据 输出端 相机 场景
系统为您推荐了相关专利信息
1
一种金融模型评估方法、装置、设备及存储介质
模型评估方法 金融 文本 图片 样本
2
一种基于雾天气深度估计的图像去雾方法及系统
图像去雾方法 训练深度估计模型 大气散射模型 生成对抗网络 去雾图像
3
融合对抗增强与因果感知机制的电力需求预测方法及系统
电力需求预测方法 变量 移动通讯基站设备 多头注意力机制 加权特征
4
肺癌患者静脉血栓栓塞风险预测系统、方法、终端及介质
静脉血栓栓塞 回归预测模型 风险预测方法 逻辑回归模型 逻辑回归方法
5
双录签名的校验方法、装置、计算机设备及存储介质
校验模型 校验方法 节点 人脸特征 客户端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号