摘要
本发明涉及图像分析技术领域,具体为一种全息听视觉融合场景的跨模态一致性建模与优化方法。首先,通过摄像头与投影设备分别采集投影图像与学生行为图像,并进行预处理,得到预处理投影图像和预处理学生行为图像;然后,对预处理投影图像进行多源关联图像增强、区域分割和多尺度特征提取,生成视觉特征并与三维声场参数对齐;接着,对预处理投影图像和预处理学生行为图像进行语义引导的图像注意力分割,并根据分割结果动态调整视觉场景参数;最后,利用基于多尺度梯度流融合与稀疏优化的图像边缘检测方法对预处理学生行为图像进行图像边缘检测,生成稀疏边缘图用于评估与反馈;本发明能够提高全息听视觉融合场景的沉浸感。
技术关键词
融合场景
听视觉
图像边缘检测方法
学生
三维声场
视觉特征
图像分割
动态场景
Retinex理论
多尺度
跨模态
语义向量
注意力
分割方法
图像增强模型
投影设备
系统为您推荐了相关专利信息
学生
数据分析算法
建立用户画像
管理系统
协同过滤算法
个性化知识图谱
学生
节点
个性化教学
教学管理方法