摘要
本发明涉及一种与文本无关的声纹识别方法、装置、电子设备及介质,属于生物特征识别技术领域,其中,该方法包括:对获取的声纹信号进行分帧处理,得到多个连续的声纹片段;对多个连续的声纹片段进行预处理后,采用预设Mel频率倒谱系数从预处理后的连续声纹片段中提取声纹特征;将提取的声纹特征输入至训练完备的目标声纹识别模型,得到声纹识别结果;其中,所述目标声纹识别模型包括CA‑Res2Net模块。本发明解决了现有技术中文本无关的声纹识别没有文本内容来帮助识别过程,需要应对不同的发音,因而识别难度大的技术问题。
技术关键词
声纹识别方法
声纹识别模型
声纹特征
文本
计算机可读程序
信号
生物特征识别技术
加权特征
声纹识别装置
注意力机制
通道
积层
电子设备
可读存储介质
多尺度特征
处理器
标签
识别模块
系统为您推荐了相关专利信息
视觉特征
多模态信息
注意力机制
文本编码器
深度学习模型
变电站倒闸操作过程
特征提取模块
电源管理模块
深度学习模型
后处理模块
文本生成图像方法
语义向量
生成图像特征
策略
多层感知机
网络虚拟身份
预测分析方法
BERT模型
周期性特征
文件特征