一种基于混合Transformer的驾驶员视线映射方法

正文

推荐专利

申请号：CN202410764384

申请日期：2024-06-14

公开号：CN118918401A

公开日期：2024-11-08

类型：发明专利

摘要

本发明涉及一种基于混合Transformer的驾驶员视线映射方法，涉及计算机视觉、图像处理、人机交互等技术领域。驾驶员的视线与驾驶员注意力和意图密切相关，为了有效估计驾驶员在驾驶过程中对道路环境的关注点，本发明提出多尺度交叉注意力网络(Multi‑Scale Cross‑Attention Network，MSCA‑Net)。该网络通过Transformer和Res net并行地提取驾驶员面部特征和眼睛特征，并在不同尺度上引入交叉注意力，有效解决了因面部图像特征冗余而导致视线映射性能下降的问题。为了有效融合驾驶员眼睛特征，提出了双眼特征融合模块(Binocular Feature Fusion Module，BFFM)，该模块通过通道注意力和空间注意力的交互来融合双眼特征，显著提升了MSCA‑Net的视线映射精度。该网络能够有效估计驾驶员视线，可广泛应用在驾驶员注意力分析和人车交互等领域。

技术关键词

注意力全局平均池化眼睛特征特征提取器驾驶员人脸映射方法驾驶员面部特征面部图像特征出面部图像图像增强模型编码器拍摄驾驶员标记融合特征注视点更新网络参数左右眼图像指标通道

系统为您推荐了相关专利信息

一种基于知识图谱的网络攻击路径预测方法及系统

动态知识图谱多源异构数据处理网络流量数据网络攻击路径风险

基于改进RT-DETR模型的遥感小目标检测方法、装置及设备

遥感图像数据检测网络模型视觉特征特征金字塔特征提取能力

一种基于毫米波雷达的非接触式心电特征点检测方法及系统

心电特征点雷达深度学习模型接触式电信号

基于语义感知图卷积网络的跨视角图像定位方法及系统

拓扑结构特征语义注意力图像定位方法交叉注意力机制动态邻接矩阵

一种基于生成模型的面瘫辅助诊断方法

辅助诊断方法面瘫患者图像修复模型图像块评估面瘫

一种基于混合Transformer的驾驶员视线映射方法

站点导航

APP 下载