摘要
本申请提供了一种基于小波变换卷积的声纹识别方法、系统、终端及介质,所述方法包括获取当前说话人的待识别语音;基于待识别语音的声纹特性提取梅尔倒谱系数特征;将梅尔倒谱系数特征输入至已训练的声纹识别模型中以对梅尔倒谱系数特征进行特征提取,获取声纹特征嵌入向量;对声纹特征嵌入向量进行识别以判断当前说话人是否为注册用户。本申请通过将多维混合小波变换卷积、注意力机制和Res2Net网络结构有机结合,显著提升了对不同频率特征的捕捉能力,且本申请进一步采用多段语音相似度计算策略,提升对复杂环境和噪声的适应能力,有效增强了声纹特征的识别精度。
技术关键词
梅尔倒谱系数
声纹识别方法
声纹特征
声纹识别模型
多通道多尺度
语音
特征提取单元
特征提取模块
声纹识别系统
残差网络
时序依赖关系
识别模块
频率
身份
存储计算机程序
终端
注意力机制
随机噪声
系统为您推荐了相关专利信息
语音唤醒模型
语音编码器
语音唤醒方法
声纹特征
样本
程序控制方法
清洁设备
语义特征
清洗物品
声纹特征
语音交互方法
语音生物特征
深度神经网络模型
迁移学习模型
带电作业环境
相机旋转设备
声纹特征
库构建方法
多模态特征
特征值