一种基于深度学习的会议大屏音视频自优化方法和系统

AITNT
正文
推荐专利
一种基于深度学习的会议大屏音视频自优化方法和系统
申请号:CN202510497430
申请日期:2025-04-21
公开号:CN120358387A
公开日期:2025-07-22
类型:发明专利
摘要
本发明公开了一种基于深度学习的会议大屏音视频自优化方法及系统,属于智能音视频处理技术领域。针对现有技术中实时性不足、跨模态协同弱及动态场景适应性差等问题,提出分域多模态参数采集与层次化融合的创新架构。方法包括:通过分时采样机制差异化采集声学参数(背景噪声频谱、声源方向角)和视频参数(光照动态范围、人脸关键点位移);利用频域掩码生成噪声抑制权重矩阵及光流法提取画面稳定性特征。实验表明,本方案在55dB噪声环境下语音信噪比提升至22.5dB,弱网场景音视频同步误差降至18ms,动态光照过曝恢复帧数减少62.5%,显著优于传统方案,为混合办公场景提供高鲁棒性、低延迟的音视频自优化解决方案。
技术关键词
音视频 分布式麦克风阵列 PID控制器 人脸关键点 参数 强化学习代理 深度学习模型 声画同步 低延迟数据处理 多模态 背景噪声 动态 输入噪声抑制 存储优化策略 生成噪声 跨模态 画面 模块 会议
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号