摘要
本申请属于视觉导航技术领域,具体涉及一种基于可容错目标定位的视觉导航方法、系统及介质,包括:使用外形与位置相似度计算模块生成所有存储的目标检测记录之间的外观和位置相似度;使用聚类模块对不同相似度的检测记录进行聚类分析;基于聚类结果,使用稀疏自注意力模块生成掩码后的注意力矩阵并对检测记录进行更新;使用目标交叉注意力模块,采用目标物体的嵌入表示作为查询向量对更新后的检测记录进行注意力运算;最后使用策略模块生成具体的智能体移动或转向动作。本发明所公开的模型通过降低非目标类别物体对定位真实目标的干扰和误导,提高了智能体的导航成功率和导航效率。
技术关键词
视觉导航方法
注意力
物体检测
递归循环神经网络
矩阵
DBSCAN算法
生成智能
视觉导航技术
多层卷积网络
视觉导航系统
图像全局特征
递归神经网络
聚类
多层感知机
语义向量
错误检测
参数
模块
外形
系统为您推荐了相关专利信息
语音情绪识别方法
稳态噪音
情绪特征
高斯混合模型
信号
观点挖掘方法
大语言模型
生成用户画像
文本
概率密度函数
狼群算法
智能网联车辆
优化神经网络
协同定位方法
优化BP神经网络
图像检测模型
神经网络模型
协方差矩阵
标签
坐标