一种基于人工智能的语音识别方法及系统

AITNT
正文
推荐专利
一种基于人工智能的语音识别方法及系统
申请号:CN202510836258
申请日期:2025-06-21
公开号:CN120564724A
公开日期:2025-08-29
类型:发明专利
摘要
本发明涉及人工智能的技术领域,尤其提供了一种基于人工智能的语音识别方法,包含通过麦克风阵列采集多路语音信号;对每路语音信号进行降噪处理,去除背景噪声,采用自适应波束形成算法对语音信号进行增强,提取目标语音信号;对预处理后的语音信号进行短时傅里叶变换,提取语音频谱特征,通过深度学习模型提取语音的高层语义特征;将提取的语音特征输入到基于注意力机制的语音识别模型中,生成目标语音的文本转录,通过自适应学习模块动态调整模型参数,优化识别结果;根据用户的实时反馈对识别结果进行校正,将校正后的数据用于模型的在线更新,提高系统的鲁棒性和适应性,具有通过高质量的数据进行训练和评估,在实时处理中降低延迟的效果。
技术关键词
语音识别方法 语音特征 注意力机制 语音识别模型 计算机可执行指令 麦克风阵列采集 频谱特征 高层语义特征 短时傅里叶变换 深度学习模型 子模块 信号 语音识别系统 校正 文本 编码器 背景噪声 解码器 频谱包络信息
系统为您推荐了相关专利信息
1
一种基于图注意力和选择状态空间网络的结构动力响应预测方法
动力响应预测方法 状态空间方程 节点 空间模块 人工神经网络模型
2
基于端到端模型的智能反射面波束成形方法及系统
波束成形方法 编码特征 反射面 波束成形系统 信号
3
一种基于深度学习的服务器数据处理方法及系统
深度学习网络模型 网络拓扑结构 模态特征 数据处理模块 注意力机制
4
一种融合非遗文化元素的模态语言模型图像编辑技术
图像编辑技术 多模态融合机制 图像特征向量 图像特征提取 生成高质量图像
5
基于AI的多模态融合招聘面试方法、设备和介质
招聘面试方法 特征提取算法 动态 数据 融合多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号