摘要
本发明提供一种车载语音识别方法、装置、电子设备及存储介质,属于语音识别技术领域,所述方法包括:对驾驶室的语音识别结果和唇语识别结果进行融合,得到多模态识别结果,所述语音识别结果是对实时采集的语音信号进行识别得到的,所述唇语识别结果是对实时采集的口型图像进行识别得到的;对所述多模态识别结果进行解析,得到各语音的语音来源,以及各所述语音对应的意图;基于各所述语音的语音来源和意图,分别生成车辆控制指令。本发明通过将语音识别结果和唇语识别结果进行结合,以区分不同来源的语音,从而在主驾驶和副驾驶同时发出语音指令时,能够对两者进行响应,同时满足两者的需求。
技术关键词
车载语音识别方法
车辆控制指令
唇语识别
意图
多模态
驾驶室
麦克风阵列
非暂态计算机可读存储介质
信号
长短期记忆网络
语音识别模型
语音识别技术
电子设备
处理器
视频流
感兴趣
计算机程序产品
图像
系统为您推荐了相关专利信息
高速公路智能
多模态数据融合
多模态数据采集
控制系统
分析模块
互联网医院平台
电子病历管理
随访系统
数据安全保护
患者
缺陷辨识方法
分布式智能
计算机程序指令
异构
图谱