摘要
本发明提供了一种采用融合增强的行人穿行意图预测方法及系统,方法包括:输入视觉信息和非视觉信息,通过视觉特征提取器从视觉信息提取视觉特征;在特征维度上拼接非视觉信息形成非视觉特征;整合视觉特征和非视觉特征得到融合特征;对融合特征添加位置编码得到位置特征,将位置特征输入Transformer模型,其输出编码特征;将编码特征输入GRU模型,GRU模型输出预测目标特征,将预测目标特征输入分类器得到行人穿行意图。本发明充分利用视觉信息和非视觉信息的互补性,加强模态之间的交互;对融合特征进行编码解码过程中采用Transformer‑GRU动作预测框架,进行长期序列建模和灵活的迭代解码,预测效果显著。
技术关键词
非视觉特征
GRU模型
视觉特征提取
意图预测方法
融合特征
编码特征
序列
车辆速度信息
多层感知机
输出特征
注意力机制
坐标
拼接模块
对象属性信息
预测系统
解码模块
编码模块
系统为您推荐了相关专利信息
血管分割方法
编码器
注意力
分支
计算机程序指令
稀疏特征选择
高层次
稀疏特征提取
融合特征
子模块
支持向量回归模型
SOH估计方法
储能电池
电池健康状态
融合特征
视觉特征
驾驶模型训练方法
核心
注意力
自动驾驶方法