摘要
本发明公开了一种基于多粒度语义指导的视线表征自监督模型及视线估计方法,属于图像分析技术领域,包括获取视线估计面部图像数据;基于多粒度上下文语义指导,构建视线表征自监督模型的网络结构,网络结构包括眼部关注的视线掩码编码器、全局面部上下文指导模块和混合上下文解码器;对网络结构进行自监督预训练,得到初始化目标网络;基于监督学习对初始化目标网络进行微调,得到用于实现视线方向估计的目标网络。本发明通过眼部及面部多粒度上下文语义指导捕捉视线特征关系,从而得到更全面的视线特征表示。适用于对视线方向的高效精准的识别。
技术关键词
网络结构
面部图像数据
视线估计方法
输入面部图像
线性分类器
编码器
掩码策略
解码器
图像嵌入
语义
交叉注意力机制
图像分析技术
像素
处理器
上下文特征
融合全局
可读存储介质
传播算法
系统为您推荐了相关专利信息
水利
工程量清单数据
可解释人工智能
合规性
电子
分布特征
图像转换模块
多层感知器
特征提取模块
网络模型结构
神经网络模型
雷达辐射源信号
信号接收模块
信号采集模块
识别系统
轻量化神经网络
识别方法
火灾
滤波器
特征提取模块