摘要
本发明涉及语音识别技术领域,尤其涉及一种基于深度学习算法的长语音方言识别方法、装置,旨在通过自适应分段策略和预训练的方言转换模型,实现对长语音数据的方言识别与转换。所述方法包括:对输入的长语音数据进行自适应分段,并通过傅里叶变换计算语音信号的连续性参数和零交叉点,确定分段长度;对分段数据进行高通滤波、小波变换和平移去噪处理,提取典型方言语音数据的特征向量;通过编码器和注意力机制计算方言标签概率,选择方言类型,并根据预训练的方言转换模型进行方言转换处理。装置采用特征提取、特征融合、概率线性鉴别分析等技术,输出方言转换结果。本发明能够有效提高长语音数据的方言识别精度和转换效果。
技术关键词
方言识别方法
语音
深度学习算法
分段
连续性
断点
短时傅里叶变换
交叉点
逻辑
分解特征
编码向量
典型
数据处理模块
门控循环单元
标签
矢量特征
融合特征
识别装置
小波变换技术