摘要
本发明公开了一种语音克隆的反诈骗识别方法、系统、设备及存储介质,属于语音克隆的防伪技术领域,解决现有语音克隆的防伪技术局限性差的技术问题。方法包括:采用频谱混淆技术在梅尔谱图生成阶段施加非均匀带通滤波,人为制造与真实语音相符的频域随机波动;采用对抗性噪声嵌入技术设计双通道对抗训练机制,生成器在合成语音中植入不可逆噪声,实现噪声隐蔽性优化,最终合成语音的MOS值在实验中达到3.792。本发明提出动态自适应帧窗口卷积算法,通过结构化噪声注入主动干扰语音克隆模型的特征提取过程,可提升合成语音克隆的难度与复杂度。
技术关键词
语音
识别方法
频率响应
混淆技术
动态
防伪技术
噪声
对抗性
复杂度
卷积算法
信号
卷积模块
子帧
识别系统
处理器
低频段
计算机设备
可读存储介质
存储器
策略
系统为您推荐了相关专利信息
电压补偿
晶闸管
比例积分控制器
电网系统
贪心算法
高中数学教学
交互技术
智能交互设备
多模态
语音识别技术
过载保护方法
温度预测模型
滑动平均滤波
LSTM算法
算法模型
车辆避障方法
运动轨迹预测
车辆行驶环境
障碍物
风险量化评估