摘要
一种基于大模型的语音多指令并行识别方法及装置,通过对获取的用户语音信号进行分帧处理,并提取多尺度语音特征,获得多尺度语音特征序列;再通过多尺度语音特征序列捕捉语音流中的指令边界信息,完成语音序列分割,生成多个候选指令片段;再将所述候选指令片段并行输入至预训练的大模型,结合语音特征与语言知识进行语义理解,输出初步指令识别结果;基于预设的知识图谱对所述初步指令识别结果进行逻辑关系推理,通过图神经网络计算各指令的最终置信度,进而对初步结果进行筛选、排序与优化,输出最终的多指令识别结果;采用以上步骤实现对语音多指令的高效并行识别,准确捕捉指令语义和逻辑关系,提高语音交互的效率和准确性。
技术关键词
并行识别方法
语音特征
指令
多尺度
语义
序列
图谱
关系
梅尔频率倒谱系数
信号
语音采集模块
命令
语音识别模块
节点
大语言模型
注意力机制
背景噪声
识别装置
系统为您推荐了相关专利信息
模版
终端设备
建筑信息模型
设备信息模型
图像采集设备
展示界面
图像格式转换
图像拍摄方法
电子设备配置
计时器
执行机构系统
主控单元
实时仿真系统
无线电通信模块
容错控制