一种基于背景噪音的合成语音检测方法、装置及存储介质

正文

推荐专利

申请号：CN202510726033

申请日期：2025-06-03

公开号：CN120260612B

公开日期：2025-07-25

类型：发明专利

摘要

本发明公开了一种基于背景噪音的合成语音检测方法、装置及存储介质，属于深度学习技术领域。该方法包括：采用编码器从原始音频中提取包含复合特征的样本编码；将样本编码输入RVQs中进行特征提取，采用隐元模型指导VQ1提取样本编码中的语义特征，并通过RVQs的残差结构将语义特征从复合特征中剥离，得到纯净声学特征；采用自然语言3代模型指导VQ2和VQ3分别提取纯净声学特征中的韵律特征和说话人信息，并将韵律特征和说话人信息从纯净声学特征中剥离，获得纯净的背景噪音信息；将背景噪音信息输入检测模型中进行语音检测，判定原始音频是否为合成音频。提高了检测效率与准确率，并确保了隐私保护和数据安全的平衡。

技术关键词

语音检测方法声学特征韵律特征语义特征残差结构自然语言注意力样本矢量量化特征提取模块语音检测装置编码器标记深度学习技术分类器音频特征数据安全

系统为您推荐了相关专利信息

一种场景图谱生成方法及系统

语义特征图谱生成方法节点彩色图像语义信息提取

一种基于时空隐式锚点查询的端到端类别级物体位姿估计方法及系统

物体位姿估计方法查询特征位姿估计系统队列多尺度语义特征

一种融合边缘语义知识的遥感大模型构建方法

边界特征模型构建方法语义特征多尺度特征融合图像

基于分布式架构的资产数据处理系统及方法

资产数据处理系统编码向量分布式架构单体资产数据处理方法

一种基于多视角交叉注意力机制的目标轮廓检测方法

交叉注意力机制轮廓检测方法多尺度语义特征空间变换网络多尺度特征金字塔

一种基于背景噪音的合成语音检测方法、装置及存储介质

站点导航

APP 下载