基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统

AITNT
正文
推荐专利
基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统
申请号:CN202510082300
申请日期:2025-01-20
公开号:CN120013992A
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于自然语言描述的无人机多模态特征融合目标跟踪方法及系统,属于计算机视觉与图像处理技术领域,解决现有技术在无人机采集的图像质量差或图像特征不明显时,易造成目标跟踪能力及长时跟踪能力差的问题。本发明无人机视角的图像中的交通事故场景进行自然语言描述,获取语言提示;构建场景‑上下文特征金字塔网络对无人机视角的图像进行上下文信息增强处理获得特征增强后的图像;对增强后的图像和语言提示分别进行视觉编码和语言编码,获得视觉特征以及语言特征向量进行视觉‑语言双模态特征局部对齐;将得到的对齐之后的新语言特征与视觉特征进行充分融合,获得多模态特征进行目标跟踪。本发明用于无人机多模态特征融合目标跟踪。
技术关键词
多模态特征融合 自然语言 无人机 视觉特征 跟踪方法 前馈神经网络 路径特征 金字塔网络 输入解码器 ROI提取方法 图像 上下文特征 注意力 双模态 定位头 视角 输出特征
系统为您推荐了相关专利信息
1
一种基于银行用户的积分兑换商城商品上架智能选品方法及系统
上架 商品推荐列表 策略 强化学习算法 选品方法
2
代码问题识别方法、装置、设备、存储介质及产品
识别方法 多模态特征融合 节点特征 图谱 关系
3
一种智能课堂反馈分析方法、装置和存储介质
智能课堂 反馈分析方法 学生 数据 生成对抗网络
4
多模态大模型数据清洗治理方法及系统
编码向量 多模态 图像视觉特征 文本 视觉特征提取
5
基于无人机的人体运动姿态纠偏方法、系统、设备及介质
人体运动姿态 骨骼关键点 纠偏方法 轮廓特征 无人机
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号