一种基于深度学习算法的长语音方言识别方法、装置

正文

推荐专利

申请号：CN202411712998

申请日期：2024-11-27

公开号：CN119446120A

公开日期：2025-02-14

类型：发明专利

摘要

本发明涉及语音识别技术领域，尤其涉及一种基于深度学习算法的长语音方言识别方法、装置，旨在通过自适应分段策略和预训练的方言转换模型，实现对长语音数据的方言识别与转换。所述方法包括：对输入的长语音数据进行自适应分段，并通过傅里叶变换计算语音信号的连续性参数和零交叉点，确定分段长度；对分段数据进行高通滤波、小波变换和平移去噪处理，提取典型方言语音数据的特征向量；通过编码器和注意力机制计算方言标签概率，选择方言类型，并根据预训练的方言转换模型进行方言转换处理。装置采用特征提取、特征融合、概率线性鉴别分析等技术，输出方言转换结果。本发明能够有效提高长语音数据的方言识别精度和转换效果。

技术关键词

方言识别方法语音深度学习算法分段连续性断点短时傅里叶变换交叉点逻辑分解特征编码向量典型数据处理模块门控循环单元标签矢量特征融合特征识别装置小波变换技术

一种基于深度学习算法的长语音方言识别方法、装置

站点导航

APP 下载