摘要
本发明涉及一种基于交叉注意力机制的驾驶员意图识别方法,涉及计算机视觉、图像处理、人机交互等技术领域。对舱内驾驶员的图像数据使用3DResnet‑50模块进行特征提取,得到其特征向量,对舱外环境数据使用光流图像的处理,以及使用一种基于ConvLSTM的编码器‑解码器方式训练的网络进行运动预测和特征提取,由于其固有的卷积能力,该结构能够解决时空序列预测问题。对于提取出的舱内和舱外的两部分特征,输入Transformer注意力模块Encoder中实现交叉注意力特征融合,最后经过FC层实现5种类别(直行、左转、右转、左变道、右变道)的概率预测。本发明将车舱内外的特征先提取再关联,使用交叉注意力机制实现特征融合,增加了意图识别预测的准确度。
技术关键词
交叉注意力机制
长短期记忆单元
意图识别
运动特征
深度卷积神经网络
神经网络架构
代表
编码器
随机梯度下降
特征提取器
图像
序列
解码器
计算机视觉
模块
系统为您推荐了相关专利信息
运动信号提取方法
构建深度神经网络
训练神经网络
特征值
PCA算法
数据标注方法
运动特征
标签特征
样本
人体运动数据
语义特征提取
深度卷积特征
残差模块
抑郁症检测系统
交叉注意力机制