摘要
一种基于语音内容脱敏和声纹匿名化的说话人匿名化方法,属于智能语音领域,包括:对原始语音进行语音识别;对文本进行预处理;使用TextRank算法进行关键词提取;进行安全词替换,得到语音内容脱敏后的文本;使用x‑vector对原始语音进行声纹特征提取;使用WGAN对声纹特征进行声纹匿名化,得到匿名化声纹;进行语音合成,得到安全语音。本发明能够在不影响语义的情况下,将语音内容的敏感词替换为安全词;同时利用WGAN算法生成匿名声纹特征,提供了稳定且高质量的生成样本;本发明具有高性能的语音特征提取能力,对环境噪声和语音变化具有较强的鲁棒性,适用于大规模的语音数据库。
技术关键词
匿名化方法
TextRank算法
节点
文本
声纹特征
生成器网络
语音特征提取
数据分布
优化网络参数
词语
关键词
语音识别系统
池化技术
深度神经网络
智能语音
信号编码
样本
元素
鲁棒性
系统为您推荐了相关专利信息
装配工艺流程
工艺设计方法
数据关联关系
规划
场景
排版模板
生成媒体内容
计算机可执行指令
编辑
超文本标记语言
智能客服系统
自然语言解析
对话状态跟踪器
大语言模型
文本
行业知识图谱
智能标签
检索系统
标识符
标签数据库
智能咨询系统
大规模语料库
功能模块
电力
深度学习方法