一种基于SASFV聚合模型的说话人确认方法

正文

推荐专利

申请号：CN202511282711

申请日期：2025-09-09

公开号：CN120766685B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于SASFV聚合模型的说话人确认方法，涉及语音识别领域，该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图，利用ERes2Net网络生成帧级特征，并引入SASFV聚合模型结合Fisher Vector变量、自注意力机制和统计方法生成固定长度的说话人级特征，最终通过余弦距离判定说话人身份。本发明解决了现有技术在短语音任务中无法有效表征和聚合特征的问题，显著提升了说话人识别系统的准确率、鲁棒性和性能。

技术关键词

短时傅里叶变换说话人身份统计方法说话人识别系统滤波器注意力机制预测输出值高斯混合模型概率密度函数音频特征线性协方差矩阵网络样本信号语音鲁棒性功率参数

系统为您推荐了相关专利信息

基于小波包和SVMD的电力系统宽频测量方法及系统

高通滤波器电力系统谐波低通滤波器宽频

用于发电机的静止式电子测速测试方法

转矩传感器嵌入式控制系统加权融合算法测试方法短时傅里叶变换

基于多教师知识蒸馏的深度伪造语音检测方法

语音检测方法教师情感特征蒸馏分类网络

一种工频电流长短期趋势滤波方法、装置以及处理设备

双闭环控制模块滤波器滤波方法电流

轻量化目标检测方法、目标检测模型的轻量化方法及装置

卷积模块滤波器特征提取模块轻量化方法图像

一种基于SASFV聚合模型的说话人确认方法

站点导航

APP 下载