基于AI视觉感知的音视频同步降噪方法及系统

正文

推荐专利

申请号：CN202411735797

申请日期：2024-11-29

公开号：CN119583849A

公开日期：2025-03-07

类型：发明专利

摘要

本发明涉及视频数据处理技术领域，一种基于AI视觉感知的音视频同步降噪方法及系统，包括：对音频数据进行预处理，得到预处理音频数据；对所述预处理音频数据进行时频分析，得到语音特征集合及背景音特征集合；对视频数据进行降噪，得到初级降噪视频数据，对初级降噪视频数据进行视觉感知，得到视频特征集合；根据所述视频特征集合，对所述语音特征集合进行基于口型特征的时间轴修正操作，得到更新时间轴；根据更新时间轴及预构建的背景音适配度序列，对进度修正音频数据进行主动降噪操作，得到噪声修正音频数据；对噪声修正音频数据与初级降噪视频数据进行合并操作得到同步降噪音视频。本发明可提高视频中图像及声音的清晰程度。

技术关键词

音频音视频语音特征降噪方法降噪模型信号特征方差算法视觉对象识别口型识别噪声变换算法视频数据处理技术滤波器降噪需求网络

系统为您推荐了相关专利信息

一种基于LLM的多模态虚假情报分析系统及方法

音频图像检索功能标签数据分析功能关键词

基于动态噪声感知的通话语音实时降噪方法及系统

语音实时降噪稳态噪声动态噪声轻量级神经网络突发噪声

一种基于多模态数据的电梯安全风险预警方法

电梯机械部件长短期记忆网络风险预警方法电梯传感器电梯轿厢

一种基于音频增强的音视频语音识别方法及系统

语音识别方法音视频视觉特征提取音频特征提取机器可读程序

一种喜庆祝福器及喜庆祝福方法

音频输入接口动画播放器后台服务器图像转换器图像识别器

基于AI视觉感知的音视频同步降噪方法及系统

站点导航

APP 下载