摘要
本发明涉及视频数据处理技术领域,一种基于AI视觉感知的音视频同步降噪方法及系统,包括:对音频数据进行预处理,得到预处理音频数据;对所述预处理音频数据进行时频分析,得到语音特征集合及背景音特征集合;对视频数据进行降噪,得到初级降噪视频数据,对初级降噪视频数据进行视觉感知,得到视频特征集合;根据所述视频特征集合,对所述语音特征集合进行基于口型特征的时间轴修正操作,得到更新时间轴;根据更新时间轴及预构建的背景音适配度序列,对进度修正音频数据进行主动降噪操作,得到噪声修正音频数据;对噪声修正音频数据与初级降噪视频数据进行合并操作得到同步降噪音视频。本发明可提高视频中图像及声音的清晰程度。
技术关键词
音频
音视频
语音特征
降噪方法
降噪模型
信号特征
方差算法
视觉
对象识别
口型识别
噪声
变换算法
视频数据处理技术
滤波器
降噪需求
网络
系统为您推荐了相关专利信息
语音实时降噪
稳态噪声
动态噪声
轻量级神经网络
突发噪声
电梯机械部件
长短期记忆网络
风险预警方法
电梯传感器
电梯轿厢
语音识别方法
音视频
视觉特征提取
音频特征提取
机器可读程序
音频输入接口
动画播放器
后台服务器
图像转换器
图像识别器