摘要
一种虚实多模态知识迁移的行人穿越预测方法及系统,包括:通过利用合成数据中的行人框对知识提取器中的教师模型进行预训练,得到获取未来p时刻的行人框数据特征;通过风格转换器,将合成数据的RGB帧在各种条件下的视觉特征转化为对应的真实RGB图;将合成深度图、合成语义分割图与真实RGB图进行整合,得到共享特征嵌入;将行人框数据特征、风格转换特征以及共享特征整合进可学习的门控单元进行融合,预测行人穿越意图信号。采用整合风格迁移、分布逼近与知识蒸馏的框架,旨在高效处理视觉、语义、深度及边界框等多元信息,以显著提升行人过马路预测的准确性。
技术关键词
多模态
风格
数据
视觉特征
教师
深度图
意图
转换器
预测系统
行人过马路
语义
网络
可读存储介质
处理器
背景噪声
计算机设备
输出模块
学生
图像
信号
系统为您推荐了相关专利信息
天线阵元
空域抗干扰方法
抗干扰需求
客户端
阵列天线
人机交互模块
氧气储存罐
控制系统
数据采集模块
需求预测模型
深度强化学习模型
网络拥塞控制方法
传输路径
字典
数据
共享电源
面板
控制系统
电源输入模块
电源分配模块