摘要
本发明一种基于视觉和非视觉信息融合的行人意图预测方法及系统,该方法包括使用Transformer编码器对非视觉信息进行预处理,得到非视觉特征向量;使用Transformer编码器对视觉信息进行预处理,得到行人局部信息二次特征和语义图像信息二次特征,将所述行人局部信息二次特征和语义图像信息二次特征拼接得到视觉特征向量;所述非视觉特征向量和视觉特征向量特征融合输入到全连接层得到输出结果,在训练过程中引入二进制交叉熵损失函数,当预测结果与真实标签不一致时,损失值会显著增大,能够有效且高效地处理不平衡数据,提高预测的准确率和鲁棒性。
技术关键词
二次特征
意图预测方法
行人局部
视觉
编码器
语义
关键点
图像
注意力机制
矩阵
门控循环单元
拼接模块
预测系统
线性
记忆
鲁棒性
元素
网络
系统为您推荐了相关专利信息
智能优化系统
驾驶者
智能交互控制
HMI界面
生理信号采集设备
毁伤评估方法
建筑
多模态
分类网络
遥感图像数据
功能模块
控制系统
能量接收模块
能量管理单元
模块化机器人单元