一种基于深度学习的会议大屏音视频自优化方法和系统

正文

推荐专利

申请号：CN202510497430

申请日期：2025-04-21

公开号：CN120358387A

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种基于深度学习的会议大屏音视频自优化方法及系统，属于智能音视频处理技术领域。针对现有技术中实时性不足、跨模态协同弱及动态场景适应性差等问题，提出分域多模态参数采集与层次化融合的创新架构。方法包括：通过分时采样机制差异化采集声学参数(背景噪声频谱、声源方向角)和视频参数(光照动态范围、人脸关键点位移)；利用频域掩码生成噪声抑制权重矩阵及光流法提取画面稳定性特征。实验表明，本方案在55dB噪声环境下语音信噪比提升至22.5dB，弱网场景音视频同步误差降至18ms，动态光照过曝恢复帧数减少62.5％，显著优于传统方案，为混合办公场景提供高鲁棒性、低延迟的音视频自优化解决方案。

技术关键词

音视频分布式麦克风阵列 PID控制器人脸关键点参数强化学习代理深度学习模型声画同步低延迟数据处理多模态背景噪声动态输入噪声抑制存储优化策略生成噪声跨模态画面模块会议

一种基于深度学习的会议大屏音视频自优化方法和系统

站点导航

APP 下载