基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统

正文

推荐专利

申请号：CN202510082300

申请日期：2025-01-20

公开号：CN120013992A

公开日期：2025-05-16

类型：发明专利

摘要

本发明公开了一种基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统，属于计算机视觉与图像处理技术领域，解决现有技术在无人机采集的图像质量差或图像特征不明显时，易造成目标跟踪能力及长时跟踪能力差的问题。本发明无人机视角的图像中的交通事故场景进行自然语言描述，获取语言提示；构建场景‑上下文特征金字塔网络对无人机视角的图像进行上下文信息增强处理获得特征增强后的图像；对增强后的图像和语言提示分别进行视觉编码和语言编码，获得视觉特征以及语言特征向量进行视觉‑语言双模态特征局部对齐；将得到的对齐之后的新语言特征与视觉特征进行充分融合，获得多模态特征进行目标跟踪。本发明用于无人机多模态特征融合目标跟踪。

技术关键词

多模态特征融合自然语言无人机视觉特征跟踪方法前馈神经网络路径特征金字塔网络输入解码器 ROI提取方法图像上下文特征注意力双模态定位头视角输出特征

系统为您推荐了相关专利信息

一种基于银行用户的积分兑换商城商品上架智能选品方法及系统

上架商品推荐列表策略强化学习算法选品方法

代码问题识别方法、装置、设备、存储介质及产品

识别方法多模态特征融合节点特征图谱关系

一种智能课堂反馈分析方法、装置和存储介质

智能课堂反馈分析方法学生数据生成对抗网络

多模态大模型数据清洗治理方法及系统

编码向量多模态图像视觉特征文本视觉特征提取

基于无人机的人体运动姿态纠偏方法、系统、设备及介质

人体运动姿态骨骼关键点纠偏方法轮廓特征无人机

基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统

站点导航

APP 下载