摘要
本发明提供了一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法。所述方法包括:使用虚幻引擎5构建虚拟仿真世界;构建行人和车辆虚拟多目标跟踪数据;构造文本‑轨迹匹配对生成多模态跟踪数据;构建逐层融合多模态语义特征的多目标跟踪模型;利用文本特征增强感知查询特征;将解码感知特征利用线性层映射到语义空间,并与编码的文本特征计算相似度;利用感知查询结果更新目标轨迹信息;本发明不仅解决了轨迹语义数据集缺失的问题,还通过逐层语义交互模块结合CLIP的跨模态对齐能力,显著提高了模型在复杂动态环境中的语义目标跟踪的准确性和召回率。
技术关键词
跟踪方法
跨模态
多层次
文本编码器
轨迹
语义特征
多模态
查询特征
大语言模型
多层感知机
视频
融合特征
数据
输入解码器
图像金字塔
图像编码器
系统为您推荐了相关专利信息
编码特征
文本情感识别方法
语音特征
跨模态
多层次
机器人定位方法
机器人路径规划方法
卡尔曼滤波模型
惯性导航定位
机器人定位装置
轨迹跟踪控制方法
实时位置
航向控制器
模糊控制规则
双闭环控制器
空间预测方法
意图
大语言模型
环境感知传感器
车道中心线
风险预测模型
非线性回归方法
环境监测数据
动态
大数据