一种基于大模型的语音多指令并行识别方法及装置

正文

推荐专利

申请号：CN202511139280

申请日期：2025-08-14

公开号：CN120877731A

公开日期：2025-10-31

类型：发明专利

摘要

一种基于大模型的语音多指令并行识别方法及装置，通过对获取的用户语音信号进行分帧处理，并提取多尺度语音特征，获得多尺度语音特征序列；再通过多尺度语音特征序列捕捉语音流中的指令边界信息，完成语音序列分割，生成多个候选指令片段；再将所述候选指令片段并行输入至预训练的大模型，结合语音特征与语言知识进行语义理解，输出初步指令识别结果；基于预设的知识图谱对所述初步指令识别结果进行逻辑关系推理，通过图神经网络计算各指令的最终置信度，进而对初步结果进行筛选、排序与优化，输出最终的多指令识别结果；采用以上步骤实现对语音多指令的高效并行识别，准确捕捉指令语义和逻辑关系，提高语音交互的效率和准确性。

技术关键词

并行识别方法语音特征指令多尺度语义序列图谱关系梅尔频率倒谱系数信号语音采集模块命令语音识别模块节点大语言模型注意力机制背景噪声识别装置

系统为您推荐了相关专利信息

一种通过自然语言操作Excel表格的方法及系统

自然语言表格训练集模型训练模块预训练模型

基于智慧车站的数据处理方法、装置及系统

模版终端设备建筑信息模型设备信息模型图像采集设备

布局布线的优化方法、装置、计算机设备和存储介质

逻辑算法指标遍历方法基础

一种图像拍摄方法及电子设备

展示界面图像格式转换图像拍摄方法电子设备配置计时器

水下航行器操控半实物仿真试验系统、方法、设备及介质

执行机构系统主控单元实时仿真系统无线电通信模块容错控制

一种基于大模型的语音多指令并行识别方法及装置

站点导航

APP 下载