一种全息听视觉融合场景的跨模态一致性建模与优化方法

AITNT
正文
推荐专利
一种全息听视觉融合场景的跨模态一致性建模与优化方法
申请号:CN202511007643
申请日期:2025-07-22
公开号:CN120783055A
公开日期:2025-10-14
类型:发明专利
摘要
本发明涉及图像分析技术领域,具体为一种全息听视觉融合场景的跨模态一致性建模与优化方法。首先,通过摄像头与投影设备分别采集投影图像与学生行为图像,并进行预处理,得到预处理投影图像和预处理学生行为图像;然后,对预处理投影图像进行多源关联图像增强、区域分割和多尺度特征提取,生成视觉特征并与三维声场参数对齐;接着,对预处理投影图像和预处理学生行为图像进行语义引导的图像注意力分割,并根据分割结果动态调整视觉场景参数;最后,利用基于多尺度梯度流融合与稀疏优化的图像边缘检测方法对预处理学生行为图像进行图像边缘检测,生成稀疏边缘图用于评估与反馈;本发明能够提高全息听视觉融合场景的沉浸感。
技术关键词
融合场景 听视觉 图像边缘检测方法 学生 三维声场 视觉特征 图像分割 动态场景 Retinex理论 多尺度 跨模态 语义向量 注意力 分割方法 图像增强模型 投影设备
系统为您推荐了相关专利信息
1
音频超分模型训练、音频超分处理方法、装置和电子设备
音频 波形 短时傅里叶变换 蒸馏 包裹相位
2
基于多模态数据的低耗式学习障碍智能筛查方法及系统
答题纸 人脸 筛查方法 学生 语音去噪
3
一种课程教学的授课管理系统
学生 数据分析算法 建立用户画像 管理系统 协同过滤算法
4
基于自适应学习分析的精准教学管理方法及系统
个性化知识图谱 学生 节点 个性化教学 教学管理方法
5
一种星地融合场景下基于GWO的移动自组网分簇组网策略
自组网 通信节点 融合场景 灰狼优化算法 策略
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号