一种全息听视觉融合场景的跨模态一致性建模与优化方法

正文

推荐专利

申请号：CN202511007643

申请日期：2025-07-22

公开号：CN120783055A

公开日期：2025-10-14

类型：发明专利

摘要

本发明涉及图像分析技术领域，具体为一种全息听视觉融合场景的跨模态一致性建模与优化方法。首先，通过摄像头与投影设备分别采集投影图像与学生行为图像，并进行预处理，得到预处理投影图像和预处理学生行为图像；然后，对预处理投影图像进行多源关联图像增强、区域分割和多尺度特征提取，生成视觉特征并与三维声场参数对齐；接着，对预处理投影图像和预处理学生行为图像进行语义引导的图像注意力分割，并根据分割结果动态调整视觉场景参数；最后，利用基于多尺度梯度流融合与稀疏优化的图像边缘检测方法对预处理学生行为图像进行图像边缘检测，生成稀疏边缘图用于评估与反馈；本发明能够提高全息听视觉融合场景的沉浸感。

技术关键词

融合场景听视觉图像边缘检测方法学生三维声场视觉特征图像分割动态场景 Retinex理论多尺度跨模态语义向量注意力分割方法图像增强模型投影设备

系统为您推荐了相关专利信息

音频超分模型训练、音频超分处理方法、装置和电子设备

音频波形短时傅里叶变换蒸馏包裹相位

基于多模态数据的低耗式学习障碍智能筛查方法及系统

答题纸人脸筛查方法学生语音去噪

一种课程教学的授课管理系统

学生数据分析算法建立用户画像管理系统协同过滤算法

基于自适应学习分析的精准教学管理方法及系统

个性化知识图谱学生节点个性化教学教学管理方法

一种星地融合场景下基于GWO的移动自组网分簇组网策略

自组网通信节点融合场景灰狼优化算法策略

一种全息听视觉融合场景的跨模态一致性建模与优化方法

站点导航

APP 下载