一种基于人工智能的语音识别方法及系统

正文

推荐专利

一种基于人工智能的语音识别方法及系统

申请号：CN202510836258

申请日期：2025-06-21

公开号：CN120564724A

公开日期：2025-08-29

类型：发明专利

摘要

本发明涉及人工智能的技术领域，尤其提供了一种基于人工智能的语音识别方法，包含通过麦克风阵列采集多路语音信号；对每路语音信号进行降噪处理，去除背景噪声，采用自适应波束形成算法对语音信号进行增强，提取目标语音信号；对预处理后的语音信号进行短时傅里叶变换，提取语音频谱特征，通过深度学习模型提取语音的高层语义特征；将提取的语音特征输入到基于注意力机制的语音识别模型中，生成目标语音的文本转录，通过自适应学习模块动态调整模型参数，优化识别结果；根据用户的实时反馈对识别结果进行校正，将校正后的数据用于模型的在线更新，提高系统的鲁棒性和适应性，具有通过高质量的数据进行训练和评估，在实时处理中降低延迟的效果。

技术关键词

语音识别方法语音特征注意力机制语音识别模型计算机可执行指令麦克风阵列采集频谱特征高层语义特征短时傅里叶变换深度学习模型子模块信号语音识别系统校正文本编码器背景噪声解码器频谱包络信息

系统为您推荐了相关专利信息

一种基于图注意力和选择状态空间网络的结构动力响应预测方法

动力响应预测方法状态空间方程节点空间模块人工神经网络模型

基于端到端模型的智能反射面波束成形方法及系统

波束成形方法编码特征反射面波束成形系统信号

一种基于深度学习的服务器数据处理方法及系统

深度学习网络模型网络拓扑结构模态特征数据处理模块注意力机制

一种融合非遗文化元素的模态语言模型图像编辑技术

图像编辑技术多模态融合机制图像特征向量图像特征提取生成高质量图像

基于AI的多模态融合招聘面试方法、设备和介质

招聘面试方法特征提取算法动态数据融合多模态特征

一种基于人工智能的语音识别方法及系统

站点导航

APP 下载