摘要
一种虚实多模态知识迁移的行人穿越预测方法及系统,包括:通过利用合成数据中的行人框对知识提取器中的教师模型进行预训练,得到获取未来p时刻的行人框数据特征;通过风格转换器,将合成数据的RGB帧在各种条件下的视觉特征转化为对应的真实RGB图;将合成深度图、合成语义分割图与真实RGB图进行整合,得到共享特征嵌入;将行人框数据特征、风格转换特征以及共享特征整合进可学习的门控单元进行融合,预测行人穿越意图信号。采用整合风格迁移、分布逼近与知识蒸馏的框架,旨在高效处理视觉、语义、深度及边界框等多元信息,以显著提升行人过马路预测的准确性。
技术关键词
多模态
风格
数据
视觉特征
教师
深度图
意图
转换器
预测系统
行人过马路
语义
网络
可读存储介质
处理器
背景噪声
计算机设备
输出模块
学生
图像
信号
系统为您推荐了相关专利信息
监测预警功能
实时数据
配电终端
供电故障
LOF算法
鲁棒性压缩感知方法
重构原始图像
接收方
迭代算法
矩阵
分区
烟气回收设备
净化设备
模型库
模型生成设备
角加速度传感器
信息采集平台
角加速度信息
里程计
IMU坐标系
聚合物分子结构
人工智能识别
检测数据输入
聚类
基团