摘要
本申请实施例提出的语音文本识别方法和装置、电子设备、存储介质,涉及人工智能技术领域及金融科技领域。该方法包括:对目标语音数据进行声谱特征提取,得到目标声谱特征;通过目标声学语言模型的输入层对目标声谱特征进行特征向量嵌入,得到目标声谱嵌入向量;通过目标声学语言模型的隐藏层对目标声谱嵌入向量进行深层特征映射,得到目标声谱深层向量;通过目标声学语言模型的循环神经网络层对目标声谱深层向量进行上下文特征提取,得到目标声谱上下文向量;通过目标声学语言模型的输出层对目标声谱上下文向量进行发音特征映射,得到目标发音特征向量;对目标发音特征向量进行文本解码,得到目标文本。本申请实施例能够提高语音文本识别准确性。
技术关键词
声谱
发音特征
样本
文本识别方法
长短期记忆神经网络
语音
标签文本
特征提取模块
文本识别装置
电子设备
可读存储介质
人工智能技术
数据获取模块
解码模块
处理器
系统为您推荐了相关专利信息
频域特征
滤波器
时域特征提取
卷积特征提取
编码
运输设备
铲装设备
装载控制方法
实时位置
物料位置信息