基于多粒度语义指导的视线表征自监督模型及视线估计方法

正文

推荐专利

申请号：CN202510177174

申请日期：2025-02-18

公开号：CN120126203A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于多粒度语义指导的视线表征自监督模型及视线估计方法，属于图像分析技术领域，包括获取视线估计面部图像数据；基于多粒度上下文语义指导，构建视线表征自监督模型的网络结构，网络结构包括眼部关注的视线掩码编码器、全局面部上下文指导模块和混合上下文解码器；对网络结构进行自监督预训练，得到初始化目标网络；基于监督学习对初始化目标网络进行微调，得到用于实现视线方向估计的目标网络。本发明通过眼部及面部多粒度上下文语义指导捕捉视线特征关系，从而得到更全面的视线特征表示。适用于对视线方向的高效精准的识别。

技术关键词

网络结构面部图像数据视线估计方法输入面部图像线性分类器编码器掩码策略解码器图像嵌入语义交叉注意力机制图像分析技术像素处理器上下文特征融合全局可读存储介质传播算法

系统为您推荐了相关专利信息

基于人工智能的水利行业电子暗标投标文件企业内审方法及系统

水利工程量清单数据可解释人工智能合规性电子

一种基于扩散模型的CT平扫生成PET图像的方法

分布特征图像转换模块多层感知器特征提取模块网络模型结构

数据质量情景检验方法、装置、设备及存储介质

多模态数据生成对抗网络检验方法模型库

一种频谱神经网络模型及由其组成的识别系统及识别方法

神经网络模型雷达辐射源信号信号接收模块信号采集模块识别系统

一种基于轻量化神经网络火灾隐患识别方法

轻量化神经网络识别方法火灾滤波器特征提取模块

基于多粒度语义指导的视线表征自监督模型及视线估计方法

站点导航

APP 下载