一种人工智能语音识别系统

AITNT
正文
推荐专利
一种人工智能语音识别系统
申请号:CN202510909757
申请日期:2025-07-02
公开号:CN120748373A
公开日期:2025-10-03
类型:发明专利
摘要
本发明公开了一种人工智能语音识别系统,包括:多模态特征提取模块:采用改进型Conformer架构同步提取语音信号的时频特征与文本嵌入向量;联合训练模块:通过对抗训练策略联合优化ASR与NMT损失函数,通过联合训练,同时学习语音识别和机器翻译任务,完成语音特征到目标语言的直接映射;语境感知翻译引擎:集成预训练语言模型的注意力机制,对提取的语音特征进行深度编码,生成跨语言的语义表示;自适应后处理模块:采用强化学习框架动态优化输出结果,根据奖励函数动态调整输出结果,优化翻译质量和语音合成效果;动态语种识别模块:基于Wave2Vec 2.0框架的实时语种分类器,实时识别输入语音的语种;增量式领域适配模块:利用LoRA微调技术快速更新领域术语库。
技术关键词
语音特征 编码器 文本 强化学习框架 多头注意力机制 后处理模块 深度编码 语种识别 微调技术 MFCC特征 预训练语言模型 高层语义特征 特征提取模块 动态 前馈神经网络 术语
系统为您推荐了相关专利信息
1
一种基于知识图谱的实体网络构建方法和系统
网络构建方法 命名实体识别技术 预训练语言模型 专业数据库 网络构建系统
2
上车解决方案的推荐方法、装置、电子设备及存储介质
网约车订单 语音通话信息 司机 语音识别模型 文本
3
一种多维指标驱动的制造企业供应链数字化转型成熟度评估方法
数据采集模块 知识图谱构建 指标 企业资源计划系统 订单
4
一种多模态智能机器人系统及交互方法
多模态智能机器人 多模态信息融合 多模态特征融合 图像采集装置 数据融合机制
5
一种血糖预测方法、系统、装置及存储介质
血糖预测方法 血糖预测模型 数据 基础胰岛素 多层感知机层
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号