一种基于大模型的语音多指令并行识别方法及装置

AITNT
正文
推荐专利
一种基于大模型的语音多指令并行识别方法及装置
申请号:CN202511139280
申请日期:2025-08-14
公开号:CN120877731A
公开日期:2025-10-31
类型:发明专利
摘要
一种基于大模型的语音多指令并行识别方法及装置,通过对获取的用户语音信号进行分帧处理,并提取多尺度语音特征,获得多尺度语音特征序列;再通过多尺度语音特征序列捕捉语音流中的指令边界信息,完成语音序列分割,生成多个候选指令片段;再将所述候选指令片段并行输入至预训练的大模型,结合语音特征与语言知识进行语义理解,输出初步指令识别结果;基于预设的知识图谱对所述初步指令识别结果进行逻辑关系推理,通过图神经网络计算各指令的最终置信度,进而对初步结果进行筛选、排序与优化,输出最终的多指令识别结果;采用以上步骤实现对语音多指令的高效并行识别,准确捕捉指令语义和逻辑关系,提高语音交互的效率和准确性。
技术关键词
并行识别方法 语音特征 指令 多尺度 语义 序列 图谱 关系 梅尔频率倒谱系数 信号 语音采集模块 命令 语音识别模块 节点 大语言模型 注意力机制 背景噪声 识别装置
系统为您推荐了相关专利信息
1
一种通过自然语言操作Excel表格的方法及系统
自然语言 表格 训练集 模型训练模块 预训练模型
2
基于智慧车站的数据处理方法、装置及系统
模版 终端设备 建筑信息模型 设备信息模型 图像采集设备
3
布局布线的优化方法、装置、计算机设备和存储介质
逻辑 算法 指标 遍历方法 基础
4
一种图像拍摄方法及电子设备
展示界面 图像格式转换 图像拍摄方法 电子设备配置 计时器
5
水下航行器操控半实物仿真试验系统、方法、设备及介质
执行机构系统 主控单元 实时仿真系统 无线电通信模块 容错控制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号