摘要
本发明涉及语音处理技术领域,可应用于金融科技及医疗健康等业务场景中,公开了一种音频信号真实性验证方法、装置、设备及介质,包括:构建原始音频文本数据集,并生成对抗样本集合,将原始音频文本数据集与对抗样本集合输入音频检测模型进行联合训练,得到经对抗训练的音频检测模型;获取待检测音频信号并提取其声学特征,获取与待检测音频信号关联的非声学特征,根据声学特征与非声学特征构建多维特征向量,将多维特征向量输入音频检测模型生成异常指标,基于异常指标执行分级响应操作。本发明通过引入对抗样本训练增强模型鲁棒性,并融合多模态特征构建多维特征向量,实现对语音克隆攻击的准确识别与分级响应。
技术关键词
真实性验证方法
音频
声学特征
多维特征向量
环境传感器数据
文本
信号
样本
生成设备
语义特征
融合多模态特征
特征提取模块
语音
语义向量
多模态特征融合
指标
时序特征
序列
系统为您推荐了相关专利信息
销售终端
智能生成方法
智能生成系统
数据模块
聚类分析方法
计算机辅助绘图
嵌入件
人工智能设计
真实世界图像
图像重建
电池热失控
预警方法
信号
冷却系统噪声
声学特征
融合语义
多模态数据融合
音频编码器
文本编码器
图像编码器
节能控制系统
采煤设备
控制执行模块
判别模块
供料