一种伪造语音原话者溯源模型构建方法

正文

推荐专利

一种伪造语音原话者溯源模型构建方法

申请号：CN202510436216

申请日期：2025-04-08

公开号：CN120260579A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种伪造语音原话者溯源模型构建方法，应用于人工智能与计算机安全技术领域。包括以下步骤：使用声纹编码器，将伪造音频样本转换为粗颗粒度的声纹特征样本；构建Transformer‑CLAP分层提纯模块，采用特征聚焦、层级融合、对比学习，得到提纯后的目标话者声纹特征；构建3级RCB残差校正模块，结合原话者身份分类器，逆向推导并恢复原话者身份标识；采用三阶段训练策略，训练得到伪造语音原话者溯源模型。本发明旨在提供一种高精度的声纹逆向恢复技术方案，以便于溯源伪造语音原话者的身份信息，对语音伪造技术的滥用行为形成震慑。

技术关键词

声纹特征模型构建方法话者声纹校正模块语音提纯矩阵样本分层注意力机制编码器融合多尺度特征学习特征身份局部细节特征频域特征代表分类器音频

系统为您推荐了相关专利信息

一种影像基因组学预测模型构建及图像标注方法

图像标注方法影像样本疾病预测模型构建方法

云手机多模态交互方法及相关设备

多模态交互方法资源分配策略深度学习模型资源分配参数模式

一种用于麦克风的使用权限管理方法及系统

非授权声纹特征会场权限管理方法辅助管理模块

一种多模态疼痛等级自动评定方法

评定方法深度卷积神经网络模型高分辨率摄像头高清动态捕捉摄像头面部表情特征

一种联合谐波特征的低带宽语音超分辨率方法

谐波特征超分辨率模型频谱特征超分辨率方法卷积模块

一种伪造语音原话者溯源模型构建方法

站点导航

APP 下载