基于多粒度语义指导的视线表征自监督模型及视线估计方法

AITNT
正文
推荐专利
基于多粒度语义指导的视线表征自监督模型及视线估计方法
申请号:CN202510177174
申请日期:2025-02-18
公开号:CN120126203A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种基于多粒度语义指导的视线表征自监督模型及视线估计方法,属于图像分析技术领域,包括获取视线估计面部图像数据;基于多粒度上下文语义指导,构建视线表征自监督模型的网络结构,网络结构包括眼部关注的视线掩码编码器、全局面部上下文指导模块和混合上下文解码器;对网络结构进行自监督预训练,得到初始化目标网络;基于监督学习对初始化目标网络进行微调,得到用于实现视线方向估计的目标网络。本发明通过眼部及面部多粒度上下文语义指导捕捉视线特征关系,从而得到更全面的视线特征表示。适用于对视线方向的高效精准的识别。
技术关键词
网络结构 面部图像数据 视线估计方法 输入面部图像 线性分类器 编码器 掩码策略 解码器 图像嵌入 语义 交叉注意力机制 图像分析技术 像素 处理器 上下文特征 融合全局 可读存储介质 传播算法
系统为您推荐了相关专利信息
1
基于人工智能的水利行业电子暗标投标文件企业内审方法及系统
水利 工程量清单数据 可解释人工智能 合规性 电子
2
一种基于扩散模型的CT平扫生成PET图像的方法
分布特征 图像转换模块 多层感知器 特征提取模块 网络模型结构
3
数据质量情景检验方法、装置、设备及存储介质
多模态 数据 生成对抗网络 检验方法 模型库
4
一种频谱神经网络模型及由其组成的识别系统及识别方法
神经网络模型 雷达辐射源信号 信号接收模块 信号采集模块 识别系统
5
一种基于轻量化神经网络火灾隐患识别方法
轻量化神经网络 识别方法 火灾 滤波器 特征提取模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号