摘要
本发明提供了一种基于虚幻引擎的多层次语义交互式跨模态跟踪方法。所述方法包括:使用虚幻引擎5构建虚拟仿真世界;构建行人和车辆虚拟多目标跟踪数据;构造文本‑轨迹匹配对生成多模态跟踪数据;构建逐层融合多模态语义特征的多目标跟踪模型;利用文本特征增强感知查询特征;将解码感知特征利用线性层映射到语义空间,并与编码的文本特征计算相似度;利用感知查询结果更新目标轨迹信息;本发明不仅解决了轨迹语义数据集缺失的问题,还通过逐层语义交互模块结合CLIP的跨模态对齐能力,显著提高了模型在复杂动态环境中的语义目标跟踪的准确性和召回率。
技术关键词
跟踪方法
跨模态
多层次
文本编码器
轨迹
语义特征
多模态
查询特征
大语言模型
多层感知机
视频
融合特征
数据
输入解码器
图像金字塔
图像编码器
系统为您推荐了相关专利信息
协同优化控制方法
逆动力学模型
拉丁超立方采样
轨迹跟踪控制
控制器
游戏技能
图形用户界面
游戏场景
触控点
虚拟对象
低功耗通信系统
低功耗通信方法
信息数据处理终端
编码模块
卡尔曼滤波算法