摘要
本发明公开了一种用于方言识别的新型动态时延神经网络,属于声学模型建模领域;具体是将现有时延神经网络引入k个并行卷积核,计算各自的注意力权重参数,加权平均后融合得到一个最优权重参数的卷积核;将该最优权重参数的卷积核替换现有时延神经网络的常规卷积核,得到改进的动态时延神经网络,根据不同的方言输入,动态调整该最优权重参数的卷积核中各权重参数,提取音频更深层次的特征信息,通过提取的深度特征与方言声学模板对比分析,最终结合分类器判定方言类别;本发明提高了判定音频所属方言种类的准确率。
技术关键词
时延
全局平均池化
声学模型建模
动态
神经网络模型
音频特征
分类器
参数
注意力
特征值
通道
模板
阶段
发音
稳态
矩阵
节点
模式
系统为您推荐了相关专利信息
人脸特征数据
导盲方法
声纹特征
导盲装置
梅尔频率倒谱系数
网络流量特征
检测工具
历史流量数据
网络设备
基线
梯级水电站
优化调度模型
长短期记忆神经网络模型
蒙特卡洛树搜索
系统优化调度方法
状态监控方法
序列
风速
主成分分析法
斯皮尔曼相关系数