语音文本识别方法和装置、电子设备、存储介质

正文

推荐专利

申请号：CN202411488718

申请日期：2024-10-23

公开号：CN119314485A

公开日期：2025-01-14

类型：发明专利

摘要

本申请实施例提出的语音文本识别方法和装置、电子设备、存储介质，涉及人工智能技术领域及金融科技领域。该方法包括：对目标语音数据进行声谱特征提取，得到目标声谱特征；通过目标声学语言模型的输入层对目标声谱特征进行特征向量嵌入，得到目标声谱嵌入向量；通过目标声学语言模型的隐藏层对目标声谱嵌入向量进行深层特征映射，得到目标声谱深层向量；通过目标声学语言模型的循环神经网络层对目标声谱深层向量进行上下文特征提取，得到目标声谱上下文向量；通过目标声学语言模型的输出层对目标声谱上下文向量进行发音特征映射，得到目标发音特征向量；对目标发音特征向量进行文本解码，得到目标文本。本申请实施例能够提高语音文本识别准确性。

技术关键词

声谱发音特征样本文本识别方法长短期记忆神经网络语音标签文本特征提取模块文本识别装置电子设备可读存储介质人工智能技术数据获取模块解码模块处理器

系统为您推荐了相关专利信息

一种基于自适应光谱块的时间序列数据异常检测方法

频域特征滤波器时域特征提取卷积特征提取编码

一种模型推理方法、装置、设备及介质

推理方法序列键值样本推理装置

物料的装载控制方法、装置、设备、介质和产品

运输设备铲装设备装载控制方法实时位置物料位置信息

一种对产品寿命进行抽检的方法、装置及存储介质

样本粒子群优化算法风险概率密度函数寿命

一种基于生物神经网络的全光智能计算控制方法及系统

障碍物车辆生物神经网络模型样本

语音文本识别方法和装置、电子设备、存储介质

站点导航

APP 下载