摘要
一种多技术协同的视线估计方法、装置、计算机程序及存储介质,属于计算机视觉领域,具体涉及到视线估计技术领域。解决了基于外观的方法中头部姿态多变、光照干扰和模型泛化性不足的问题。所述方法包括:采集图像;利用多任务卷积神经网络检测人脸边框和特征点,裁剪出人脸图像,再通过Dlib获取眼睛关键点,裁剪出眼睛图像并归一化;用MobileNet v2提取人脸与眼睛特征,同时利用3DMM和PnP算法获得头部姿态;通过跨层动态卷积模块增强人脸特征,通过GAT处理头部姿态特征和人脸特征获得增强特征,拼接增强特征、增强人脸特征和眼睛特征,获得综合特征;基于综合特征采用CAS‑ViT获得估计视线向量。适用于人机交互、智能交通、医疗健康、等领域。
技术关键词
视线估计方法
人脸关键点
姿态特征
人脸特征点
图像
卷积模块
坐标
注意力
眼睛特征
视线估计技术
视线估计装置
人脸模型
计算机储存介质
网络
中间层
系统为您推荐了相关专利信息
无人机多光谱图像
卫星遥感图像
光伏板发电量
融合特征
输出特征
可见光强度
可见光图像
可见光传感器
识别方法
识别系统
图像检测模型
鱼类出血病
循环生成对抗网络
信息处理方法
训练集