摘要
本申请实施例公开了一种语音处理方法及装置。主要技术方案包括:接收语音指令,并将所述语音指令转换为语音文本;将所述语音文本和状态表信息并行输入语音处理模型和决策处理模型中,其中:利用所述语音处理模型生成第一回复文本,并将所述第一回复文本转换为第一回复语音并输出;利用所述决策处理模型生成第一任务规划指令;响应于所述第一任务规划指令指示存在待执行任务,执行所述待执行任务;其中,所述语音处理模型和所述决策处理模型由至少一个大语言模型实现,所述状态表信息至少包括所述智能终端的当前环境信息和/或当前状态信息。本申请能够显著降低语音响应延迟,满足语音实时交互的需求。
技术关键词
语音
文本
决策
规划
大语言模型
智能终端
序列
存储程序指令
计算机程序产品
处理器
可读存储介质
存储器
标识
节点
电子设备
系统为您推荐了相关专利信息
街景
图像特征向量
事件风险评估
城市街道
开放街道地图
企业画像
BiLSTM模型
实时监控系统
度计算方法
数据安全
媒体
内容生成方法
计算机执行指令
文本生成模型
基础
语义
层级
业务系统
意图识别
非易失性计算机可读存储介质