一种基于深度学习的语音识别和人机交互系统及方法

正文

推荐专利

申请号：CN202411464860

申请日期：2024-10-21

公开号：CN119007711B

公开日期：2025-01-10

类型：发明专利

摘要

本发明涉及语音识别的技术领域，公开了一种基于深度学习的语音识别和人机交互系统及方法。本发明首先获取初始语音信号，对初始语音信号进行预处理，得到处理后的语音信号；其次根据处理后的语音信号得到时域信号，根据时域信号计算得到帧的能量集合、梅尔倒谱系数集合和二阶差分集合，组成梅尔倒谱系数特征集合；再训练CNN神经网络和RNN神经网络分别得到声学模型和语言模型，对语音进行识别；根据语音识别结果生成初始语音识别文本，对初始语音识别文本进行预处理和词向量转换，计算相似度，最后根据相似度输出回复文本，实现人机交互。本发明通过对语音信号进行处理达到语音识别和人机交互目的，方法客观且准确。

技术关键词

梅尔倒谱系数神经网络模型人机交互方法语音识别文本处理 RNN神经网络训练词向量模型语音信号降噪中文自然语言语音识别语言模型语音信号处理短时傅里叶变换语音识别模型样本人机交互系统音频特征提取模块

一种基于深度学习的语音识别和人机交互系统及方法

站点导航

APP 下载