基于AI视觉感知的音视频同步降噪方法及系统

AITNT
正文
推荐专利
基于AI视觉感知的音视频同步降噪方法及系统
申请号:CN202411735797
申请日期:2024-11-29
公开号:CN119583849A
公开日期:2025-03-07
类型:发明专利
摘要
本发明涉及视频数据处理技术领域,一种基于AI视觉感知的音视频同步降噪方法及系统,包括:对音频数据进行预处理,得到预处理音频数据;对所述预处理音频数据进行时频分析,得到语音特征集合及背景音特征集合;对视频数据进行降噪,得到初级降噪视频数据,对初级降噪视频数据进行视觉感知,得到视频特征集合;根据所述视频特征集合,对所述语音特征集合进行基于口型特征的时间轴修正操作,得到更新时间轴;根据更新时间轴及预构建的背景音适配度序列,对进度修正音频数据进行主动降噪操作,得到噪声修正音频数据;对噪声修正音频数据与初级降噪视频数据进行合并操作得到同步降噪音视频。本发明可提高视频中图像及声音的清晰程度。
技术关键词
音频 音视频 语音特征 降噪方法 降噪模型 信号特征 方差算法 视觉 对象识别 口型识别 噪声 变换算法 视频数据处理技术 滤波器 降噪需求 网络
系统为您推荐了相关专利信息
1
一种基于LLM的多模态虚假情报分析系统及方法
音频 图像检索功能 标签 数据分析功能 关键词
2
基于动态噪声感知的通话语音实时降噪方法及系统
语音实时降噪 稳态噪声 动态噪声 轻量级神经网络 突发噪声
3
一种基于多模态数据的电梯安全风险预警方法
电梯机械部件 长短期记忆网络 风险预警方法 电梯传感器 电梯轿厢
4
一种基于音频增强的音视频语音识别方法及系统
语音识别方法 音视频 视觉特征提取 音频特征提取 机器可读程序
5
一种喜庆祝福器及喜庆祝福方法
音频输入接口 动画播放器 后台服务器 图像转换器 图像识别器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号