摘要
本发明公开了一种目标导向的扫视路径预测方法,属于路径预测领域。本发明提取目标语义信息和场景图像的多层级视觉信息;将目标语义信息和多层级视觉信息融合为联合特征信息;将所有注视点的查询信息和联合特征信息一起输入到扫视路径解码器中,采用并行的方式预测所有注视点的隐藏状态信息;将所有注视点的隐藏状态信息一起输入一个扫视路径头中,将其转化为坐标值X、坐标值Y、持续时间T和终止概率值V等参数;最后遍历所有的注视点,如果当前注视点的终止概率值小于0.5,则将该注视点的坐标值和持续时间加入扫视路径,否则,停止遍历。本发明提出的模型可以在目标导向的场景中生成更加真实可靠的扫视路径。
技术关键词
扫视路径预测方法
注视点
代表
视觉特征
层级
语义特征
融合特征
解码器
位置编码信息
文本
场景
图像分割
有效性
实例分割
队列
参数
线性
系统为您推荐了相关专利信息
综合能源系统
分时段
序列
优化调度模型
多尺度排列熵
数据监督方法
云端数据平台
多场景
数据中心
场景特征
视觉特征
轨迹
多头注意力机制
全局特征提取
运动
视网膜动脉阻塞
风险评估系统
风险评估模型
生物标志物
患病风险评估