基于多模态多尺度特征融合的驾驶人注意力焦点预测方法和系统

正文

推荐专利

申请号：CN202510573908

申请日期：2025-05-06

公开号：CN120544168A

公开日期：2025-08-26

类型：发明专利

摘要

本发明提供基于多模态多尺度特征融合的驾驶人注意力焦点预测方法和系统，包括：多模态数据采集与预处理；采用多分支卷积神经网络CNN，分别从多模态数据中提取多尺度特征，然后对提取的特征进行融合，输出多尺度融合特征图；通过自注意力机制捕获空间依赖关系，并嵌入位置编码保留几何信息；再通过ConVLSTM建模时序动态连续帧的融合特征堆叠为时序序列作为输入，通过粗粒度预测头，定位高风险区域；通过细粒度预测头，输出像素级注意力热力图，精确标注焦点区域；设计损失函数进行训练；利用训练好的整体网络模型实现驾驶人注意力焦点预测。本发明兼顾精度与效率，显著提升了驾驶人注意力焦点预测模型的泛化能力和实用性。

技术关键词

多尺度特征融合焦点融合特征图像嵌入位置编码多模态数据采集语义特征高风险注意力机制网络细粒度特征直方图均衡化热力图稠密光流

基于多模态多尺度特征融合的驾驶人注意力焦点预测方法和系统

站点导航

APP 下载