一种用于麦克风阵列会议设备的语音识别方法及装置

正文

推荐专利

申请号：CN202411137459

申请日期：2024-08-19

公开号：CN118887956B

公开日期：2025-10-03

类型：发明专利

摘要

本申请涉及智能语音交互技术领域，公开了一种用于麦克风阵列会议设备的语音识别方法及装置，其方法包括获取任一单通道的输入音频；采用预设的3A模型对输入音频进行频带建模，融合提取的特征，经过复数网络计算，得到一个掩码作用于输入音频以得到目标音频；将目标音频输入预设的语音唤醒模型，确定唤醒词的音频段；判断是否存在人声；若存在人声，则利用预设的提取模型提取唤醒人声纹特征，确定唤醒人的音频段；将当前帧的唤醒人的音频段输入预设的人声识别模型进行人声指令识别，得到唤醒人的人声指令，通过语言模型识别人声指令对应的意图，并响应唤醒人的人声指令。本申请具有在会议室多人讲话的场景下，改善人声指令和唤醒词识别精度的效果。

技术关键词

语音识别方法麦克风阵列会议设备音频语音唤醒模型人声识别声纹特征识别语音数据智能语音交互技术文本指令输入端意图实体唤醒词检测方位角模块语音识别装置

系统为您推荐了相关专利信息

语音合成方法、语音合成模型训练方法及相关装置

样本注意力音频特征子模块声纹验证系统

一种多声源同时计数和定位的方法及装置

直方图多声源搜索算法麦克风阵列采集频率

一种可变形的轮式多功能服务机器人

多功能服务机器人伺服电机移动底盘传感机构轮式

用于训练音频处理模型的方法、装置、设备和存储介质

噪声数据音频编码器模块采样率计算机可执行指令

素材库补充方法和装置

关键词热点图像特征向量文本分析模型计算机程序产品

一种用于麦克风阵列会议设备的语音识别方法及装置

站点导航

APP 下载