摘要
本申请涉及一种基于视觉编码器的视线目标位置估计方法,属于计算机视觉的技术领域。方法包括:基于视频帧生成对应的图片特征,检测图片特征中目标特征的位置;其中,目标特征包括人脸、人手、挡位、方向盘和手刹;基于场景编码器和凝视目标解码器构建视线估计模型,基于人脸位置对视线估计模型进行训练;利用训练后视线估计模型根据人脸位置生成视线的估计点坐标和坐标是否在图像中的概率值;基于目标特征的位置、视线的估计点坐标和坐标是否在图像中的概率值判断车内人员视线关注位置。采用单场景编码器和轻量化的凝视目标解码器构建视线估计模型,结构简单,计算量小,解决传统多分支方法的复杂性高、计算冗余的问题。
技术关键词
人脸位置
场景特征
坐标
位置估计方法
方向盘
解码器
手刹
编码器
挡位
标记
图像
视频帧
人手
图片
令牌
模型训练模块
特征提取模块
多层感知机
生成场景
系统为您推荐了相关专利信息
磁屏蔽系统
梯度线圈
非线性
补偿控制电路
子系统