摘要
本发明公开了一种检测目标重建方法、系统、终端及介质,方法包括:获取检测目标的原始图像与文本提示信息;对原始图像与文本提示信息进行融合得到多模态特征;基于多模态特征通过检测器得到检测目标的检测框、检测目标的类别置信度以及检测目标的查询特征;确定原始图像所对应的视觉特征,并基于视觉特征与多模态特征通过检测器得到检测特征;根据检测目标的检测框、检测目标的类别置信度、检测目标的查询特征以及检测特征通过解码器,得到检测目标的二维关键点坐标、检测目标的三维关键点坐标以及相机位置坐标。本发明避免了重复特征提取的问题,大幅提升了计算效率,消除了误差逐步累积的弊端,提高了重建结果的精确性和鲁棒性。
技术关键词
查询特征
关键点
多层感知机
视觉特征
相机
注意力机制
检测器
坐标
检测解码器
文本
图像
卷积特征
多模态特征融合
样本
可读存储介质
置信度阈值
重建系统
处理器
系统为您推荐了相关专利信息
在线监测系统
骨料粒径
图像处理模块
模型压缩
更新模型参数
运输控制系统
综放工作面
开采煤炭
运输机
受料槽
畸变参数
CPU模块
图像处理方法
相机
图像处理模型