摘要
本发明提供一种基于声纹特征的身份识别方法及装置,对获取到的语音数据进行预处理,得到预处理音频;利用音频分离模型和残差去噪扩散模型对预处理音频进行降噪处理,得到降噪音频;从降噪音频中提取声学特征,分析不同噪声下的声学特征的各维度,得到各维度的权重系数;基于权重系数对声学特征的各维度进行加权处理,得到特征矩阵;根据特征矩阵和特征分类模型进行特征比对,确定语音数据对应的用户身份。音频分离模型和残差去噪扩散模型进行语音降噪,去除环境噪音,提高语音信号的清晰度,增强系统的鲁棒性。采用特征分类模型对多个用户音频进行分离,有效减少干扰,从而提高声纹识别率。同时,特征矩阵也显著提升了模型的识别效率和准确性。
技术关键词
声学特征
短时傅里叶变换
音频
声纹特征
梅尔倒谱系数
身份识别方法
数据
矩阵
降噪模型
模块
降噪单元
高通滤波器
噪声
语音特征
身份识别装置
频率
分析单元
系统为您推荐了相关专利信息
智能装饰设计系统
多模态数据融合
特征提取模块
注意力机制
数据采集模块
手语
树数据结构
分层建模方法
骨骼动画数据
预加载机制