摘要
本发明提供一种基于多尺度自适应特征调制的车内注视估计方法,涉及计算机科学与技术的技术领域,包括以下步骤:多尺度特征提取,将人脸图像输入基于跨阶段局部架构的主干网,通过主干网提取多尺度特征图;特征增强与融合,将多尺度特征图分别输入3D‑SAFM模块进行多尺度特征增强,获得增强后的多尺度特征,并通过3D‑MFFM模块学习多尺度特征间的深层关系;注视估计,将得到的多尺度特征进行拼接,将其拼接成一个特征信息,即混合增强后的多尺度特征,利用Transformer提取远距离依赖关系,最终通过多层感知机输出视线估计结果。本发明在智能驾驶安全监测、车载人机交互等领域具有重要应用价值,为复杂场景下的高精度视线估计提供了高效解决方案。
技术关键词
估计方法
多尺度特征提取
车载人机交互
多层感知机
通道
注意力
分辨率
模块
上采样
远距离
非线性
关系
分块
人脸
元素
网络
序列
阶段
系统为您推荐了相关专利信息
多光谱图像处理
焊缝
模糊PID控制
打磨设备
多光谱相机
智能人机交互系统
骨骼特征
多层感知机层
训练预测模型
骨骼关键点
防撞控制系统
障碍物
概率密度函数
机组
核密度估计方法
图像分割模型
图像分割方法
双极化天气雷达
深度神经网络
天气雷达技术
储能电站电池
SOH估计方法
构建测试数据
周期
交叉验证法