一种基于Transformer全局语义编码的眼动识别方法

AITNT
正文
推荐专利
一种基于Transformer全局语义编码的眼动识别方法
申请号:CN202411380959
申请日期:2024-09-30
公开号:CN119479048B
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及一种基于Transformer全局语义编码的眼动识别方法,涉及眼动识别领域。包括:根据不同的任务需求采集相应的眼动数据,构建眼动识别数据集;所述眼动数据集包括图像和观看图像对应的眼动数据;根据眼动数据中记录的注视点位置,对相关图像进行注视点处掩码处理,将掩码处理的图像和未被掩码图像作为Transformer模型的输入;对Transformer模型进行预训练;利用预训练的Transformer模型从每幅图像的所有注视点位置提取深层特征,基于深层特征预测基于图像的类别概率;整合基于图像的类别概率得到受试者的综合分类结果。有效解决了现有眼动识别方法对深层语义信息挖掘不足和无法捕捉全局依赖关系的问题。
技术关键词
注视点 眼动数据 计算机可执行指令 眼动识别方法 位置提取 图像块 可读存储介质 池化方法 计算机程序产品 注意力机制 计算机系统 图像分割 处理器 视觉 训练集 标记
系统为您推荐了相关专利信息
1
光伏组件边缘位置提取方法、装置、存储介质及机器人
光伏组件边缘 端点 位置提取方法 直线 轮廓
2
一种拟态调度判决方法、系统、电子设备、介质及产品
异构 判决方法 计数器 判决系统 计算机可执行指令
3
一种基于多主体协同的档案记录追溯方法及系统
加密数据 追溯方法 时序 长短期记忆神经网络 身份
4
目标检测候选框筛选方法及装置
指数算法 筛选方法 置信度阈值 计算机可执行指令 模块
5
基于眼动数据的用户行为分类方法、装置、设备和介质
眼动数据 分类方法 眼动特征 图像特征向量 坐标
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号