摘要
本发明公开了一种面向伪造音频的检测特征增强方法、系统设备及介质,具体涉及属于信息安全领域。首先通过变分自编码器将原始音频编码为高维潜在表示,并结合音频‑文本对比学习模型生成的参考嵌入参数输入扩散模型;利用扩散模型对潜在表示进行多步去噪,生成纯净语音特征后解码为增强音频。随后通过特征质量优化模块处理音频,输入深度伪造检测模型得到检测评分矩阵,根据预设阈值判断是否进行模型迭代优化:若加权评分超过阈值,则通过损失函数更新检测模型参数,最终输出优化后的检测模型及结果。本发明能够处理不同种类的带噪声的语音输入,具有适应未知种类的噪声的重要潜力,用于对伪造音频特征进行高精度检测。
技术关键词
音频特征
矩阵
编码器
预训练模型
音频编码
处理器
语音特征
系统设备
计算机系统
解码
文本
存储器
噪声
超参数
可读存储介质
波形
电子设备
系统为您推荐了相关专利信息
旋转机械零部件
大语言模型
故障诊断方法
样本
故障诊断模型
可重构天线阵列
波束成形方法
毫米波频段
信号传输模型
PIN二极管
支持向量机模型
变分自动编码器
企业ERP系统
接口
神经网络结构
路线规划方法
蒙特卡洛树
搜索算法
神经网络算法
分子