一种人工智能语音识别系统

正文

推荐专利

一种人工智能语音识别系统

申请号：CN202510909757

申请日期：2025-07-02

公开号：CN120748373A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种人工智能语音识别系统，包括：多模态特征提取模块：采用改进型Conformer架构同步提取语音信号的时频特征与文本嵌入向量；联合训练模块：通过对抗训练策略联合优化ASR与NMT损失函数，通过联合训练，同时学习语音识别和机器翻译任务，完成语音特征到目标语言的直接映射；语境感知翻译引擎：集成预训练语言模型的注意力机制，对提取的语音特征进行深度编码，生成跨语言的语义表示；自适应后处理模块：采用强化学习框架动态优化输出结果，根据奖励函数动态调整输出结果，优化翻译质量和语音合成效果；动态语种识别模块：基于Wave2Vec 2.0框架的实时语种分类器，实时识别输入语音的语种；增量式领域适配模块：利用LoRA微调技术快速更新领域术语库。

技术关键词

语音特征编码器文本强化学习框架多头注意力机制后处理模块深度编码语种识别微调技术 MFCC特征预训练语言模型高层语义特征特征提取模块动态前馈神经网络术语

系统为您推荐了相关专利信息

一种基于知识图谱的实体网络构建方法和系统

网络构建方法命名实体识别技术预训练语言模型专业数据库网络构建系统

上车解决方案的推荐方法、装置、电子设备及存储介质

网约车订单语音通话信息司机语音识别模型文本

一种多维指标驱动的制造企业供应链数字化转型成熟度评估方法

数据采集模块知识图谱构建指标企业资源计划系统订单

一种多模态智能机器人系统及交互方法

多模态智能机器人多模态信息融合多模态特征融合图像采集装置数据融合机制

一种血糖预测方法、系统、装置及存储介质

血糖预测方法血糖预测模型数据基础胰岛素多层感知机层

一种人工智能语音识别系统

站点导航

APP 下载