摘要
本发明公开了一种基于情感分析的音频深度伪造检测方法及系统,属于人工智能安全领域。包括提取输入语音的梅尔频谱图及其一阶和二阶导数,形成三维矩阵;采用迁移学习策略从预训练的语音情感识别系统中提取三维矩阵的情感特征向量;将提取的情感特征向量输入到合成语音检测器中,判断输入语音是真实语音还是深度伪造语音。本发明基于深度伪造技术无法准确重现自然情感行为的特点,通过分析语音中的高级情感特征来检测深度伪造语音,提高了检测系统在跨数据集和噪声环境下的鲁棒性,有效提升了音频安全防护能力。
技术关键词
语音情感识别系统
迁移学习策略
短时傅里叶变换
音频
卷积循环神经网络
矩阵
时序依赖关系
语音检测器
特征提取模块
情感特征
带通滤波器
注意力
时序特征
随机森林
线性
频率
分类器
鲁棒性
系统为您推荐了相关专利信息
换刀机构
更换刀具
原始图像数据
节点
重构图像数据
情感分析方法
视频特征向量
文本特征向量
跨模态
多任务
音视频推荐方法
生成特征向量
文本特征向量
时序
文字提取技术