摘要
本发明提供了一种基于人工智能的语音处理方法及系统,通过获取包含干净语音和带噪或受损语音的数据集,对所述数据集进行归一化处理,将归一化处理后的语音信号转换为梅尔频谱图形式,然后构建基于生成对抗网络的语音增强与修复模型,利用生成器和判别器的对抗训练机制,能够有效提高语音增强与修复的效果,生成高质量的语音信号,解决了传统方法在复杂环境下效果不佳的问题。
技术关键词
生成器网络
多层卷积神经网络
语音特征
积层
短时傅里叶变换
生成对抗网络
可读存储介质
信号
频率转换
非线性
传播算法
数据分布
电子设备
参数
存储器
处理器
输入模块
系统为您推荐了相关专利信息
燃料调节模块
工业锅炉燃烧
振荡特征
炉膛温度场
次声波
电磁频谱监测
干扰识别方法
干扰信号特征
数据
频谱特征
克隆选择算法
实时监测数据
判别准则
记忆单元
空间分布函数
动态适配方法
LED屏
语音特征数据
LED显示屏
生物传感器
双向长短期记忆网络
线性规划模型
实时监测数据
历史运行数据
节点