摘要
本发明公开了一种基于三维点云和表面重建技术的视线估计方法,包含以下步骤:S1到S4是模型训练阶段:S1、获取对公共数据集中的数据进行预处理,得到固定大小的眼部图像灰度图和真实注视球;S2、构建并初始化模型,并输入处理好的训练数据;S3、通过连续标准化流(CNF)的前向可逆变换,从潜在空间中采样并重建多个候选注视球,使用重建损失和熵损失优化模型;S4、使用注视球注意力融合(GSAF)模块候选注视球处理,选择点云融合(PCF)机制或注视方向融合(GDF)机制,预测视线方向,使用L2损失优化模型,得到最终训练好的模型。S5到S8是模型测试评估阶段:S5、输将测试数据的眼部灰度图像输入到训练好的模型;S6、提取图像特征,CNF模块生成多个候选注视球;S7、使用不同的融合策略(点云融合或注视球融合),得到预测视线方向;S8、计算相关指标,评估模型性能。
技术关键词
表面重建技术
视线估计方法
图像
注意力
融合策略
模块
眼球
变量
点云
更新模型参数
数据
编码器
虹膜
球体
深度学习模型
正则化参数
特征提取器
重建误差
机制
网络
系统为您推荐了相关专利信息
三维建模方法
激光雷达设备
生成三维模型
点云数据处理系统
膨胀算法
可视化预测方法
轮毂轴承
动态
Arrhenius模型
材料塑性成形技术
自主避障系统
物探专用
像素点
图像分割信息
障碍物
动火作业
监测方法
监控图像数据
灭火设备
虚拟环境模型
跨尺度特征融合
遥感图像识别方法
上采样
图像编码
图像识别模块