多音区语音识别方法、装置、设备及计算机可读存储介质

正文

推荐专利

申请号：CN202410923078

申请日期：2024-07-10

公开号：CN118762694A

公开日期：2024-10-11

类型：发明专利

摘要

本发明涉及车载语音识别技术领域，公开了一种多音区语音识别方法、装置、设备及计算机可读存储介质，本发明的多音区语音识别方法通过多音区麦克风阵列获取声音信号；根据各音区麦克风阵列获取的声音信号确定声源位置；根据声源位置、声音信号的振幅和频谱特性对声音信号进行增益调整，获得优化语音信号；对优化语音信号进行识别，获得语音指令。由于是通过车内的多个音区的麦克风阵列分别获取声音信号对应的声源位置进行信号增益调整，能够对车内空间进行全面覆盖；通过各个麦克风阵列的协同工作，还可以进一步提高声音识别的准确性。本申请的方案在确保了车内的语音信号都能够被有效捕捉的同时，减少了环境噪声的干扰，提高了语音识别的准确性。

技术关键词

麦克风阵列优化语音信号语音识别方法语音识别设备信号特征车载语音识别技术语音识别装置可读存储介质参数语音识别模块通信接口存储器计算机处理器指令定位模块时间差

系统为您推荐了相关专利信息

一种基于工业清洁机器人的安全巡检方法

控制清洁机器人巡检方法视觉采集装置异常设备麦克风阵列

基于语音驱动的超融合人员智能管理控制系统及方法

智能管理控制系统考勤终端麦克风传感器时延智能考勤管理

一种基于无线电识别的低空管控数据获取方法及系统

数据获取方法飞行器无线电数据获取系统轨迹绘制单元

语音识别模型训练方法、语音识别方法、装置和存储介质

语音识别模型标签音频大语言模型语音识别方法

一种特征匹配与映射学习的辐射源信号识别方法

信号识别模型辐射源小波散射网络信号识别方法分类器

多音区语音识别方法、装置、设备及计算机可读存储介质

站点导航

APP 下载