摘要
本发明属于图像处理领域,公开了一种基于深度空间变换的注视目标估计方法及相关装置,根据学生视角图像的深度图和教师视角图像的深度图得到坐标变换参数,根据学生视角图像的学生面部图像以及学生头部在图像的位置得到学生的视锥参数,根据教师视角图像的教师行为特征得到教师视角图像的显著性热图,然后结合上述结果得到学生在教师视角图像的像素级注视目标热图。该估计方法结合双视角深度空间变换,并通过对显著性、凝视姿势和两种视图角之间几何关系的联合估计,实现学生与被观测物体不在同一视角图像情况下注视目标的估计,解决了线下课堂目标估计中的深度信息缺失、双视角坐标系不对齐和对多人多物教室环境全局上下文建模能力不足等问题。
技术关键词
视角
教师
学生
深度图
解码器模型
参数
面部
编码器
多层感知机
坐标
深度估计方法
像素
ReLU函数
图像获取模块
可读存储介质
处理器
计算机设备
编解码