一种基于SASFV聚合模型的说话人确认方法

AITNT
正文
推荐专利
一种基于SASFV聚合模型的说话人确认方法
申请号:CN202511282711
申请日期:2025-09-09
公开号:CN120766685B
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于SASFV聚合模型的说话人确认方法,涉及语音识别领域,该方法通过短时傅里叶变换和梅尔滤波提取对数梅尔谱图,利用ERes2Net网络生成帧级特征,并引入SASFV聚合模型结合Fisher Vector变量、自注意力机制和统计方法生成固定长度的说话人级特征,最终通过余弦距离判定说话人身份。本发明解决了现有技术在短语音任务中无法有效表征和聚合特征的问题,显著提升了说话人识别系统的准确率、鲁棒性和性能。
技术关键词
短时傅里叶变换 说话人身份 统计方法 说话人识别系统 滤波器 注意力机制 预测输出值 高斯混合模型 概率密度函数 音频特征 线性 协方差矩阵 网络 样本 信号 语音 鲁棒性 功率 参数
系统为您推荐了相关专利信息
1
基于小波包和SVMD的电力系统宽频测量方法及系统
高通滤波器 电力系统 谐波 低通滤波器 宽频
2
用于发电机的静止式电子测速测试方法
转矩传感器 嵌入式控制系统 加权融合算法 测试方法 短时傅里叶变换
3
基于多教师知识蒸馏的深度伪造语音检测方法
语音检测方法 教师 情感特征 蒸馏 分类网络
4
一种工频电流长短期趋势滤波方法、装置以及处理设备
双闭环控制 模块 滤波器 滤波方法 电流
5
轻量化目标检测方法、目标检测模型的轻量化方法及装置
卷积模块 滤波器 特征提取模块 轻量化方法 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号