多音区语音识别方法、装置、设备及计算机可读存储介质

AITNT
正文
推荐专利
多音区语音识别方法、装置、设备及计算机可读存储介质
申请号:CN202410923078
申请日期:2024-07-10
公开号:CN118762694A
公开日期:2024-10-11
类型:发明专利
摘要
本发明涉及车载语音识别技术领域,公开了一种多音区语音识别方法、装置、设备及计算机可读存储介质,本发明的多音区语音识别方法通过多音区麦克风阵列获取声音信号;根据各音区麦克风阵列获取的声音信号确定声源位置;根据声源位置、声音信号的振幅和频谱特性对声音信号进行增益调整,获得优化语音信号;对优化语音信号进行识别,获得语音指令。由于是通过车内的多个音区的麦克风阵列分别获取声音信号对应的声源位置进行信号增益调整,能够对车内空间进行全面覆盖;通过各个麦克风阵列的协同工作,还可以进一步提高声音识别的准确性。本申请的方案在确保了车内的语音信号都能够被有效捕捉的同时,减少了环境噪声的干扰,提高了语音识别的准确性。
技术关键词
麦克风阵列 优化语音信号 语音识别方法 语音识别设备 信号特征 车载语音识别技术 语音识别装置 可读存储介质 参数 语音识别模块 通信接口 存储器 计算机 处理器 指令 定位模块 时间差
系统为您推荐了相关专利信息
1
一种基于工业清洁机器人的安全巡检方法
控制清洁机器人 巡检方法 视觉采集装置 异常设备 麦克风阵列
2
基于语音驱动的超融合人员智能管理控制系统及方法
智能管理控制系统 考勤终端 麦克风传感器 时延 智能考勤管理
3
一种基于无线电识别的低空管控数据获取方法及系统
数据获取方法 飞行器 无线电 数据获取系统 轨迹绘制单元
4
语音识别模型训练方法、语音识别方法、装置和存储介质
语音识别模型 标签 音频 大语言模型 语音识别方法
5
一种特征匹配与映射学习的辐射源信号识别方法
信号识别模型 辐射源 小波散射网络 信号识别方法 分类器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号