摘要
本申请公开了一种基于大模型的语音交互方法、装置、相关设备及程序产品,涉及人工智能技术领域,对于用户的输入语音指令,调用语音识别引擎进行语音识别,在得到识别文本后通过任务分类模型预测当前任务类型,若确定本次交互需要参考知识信息,则在调用知识检索工具检索目标知识的同时,异步地获取配置的垫话内容并输出。当检索到目标知识后拼接识别文本,利用拼接文本调用大模型生成回复文本并输出。本申请为了降低知识检索过程所带来的时延,在知识检索过程异步调用配置的垫话内容进行输出,通过交互垫话功能平滑过渡时间,降低了语音交互的响应时延。确保能够结合检索到的目标知识来调用大模型生成最终回复文本,保证大模型的生成质量。
技术关键词
文本
语音交互方法
语音识别引擎
数据处理单元
模块
语音交互装置
语音交互系统
人工智能技术
计算机程序产品
队列
处理器
时延
可读存储介质
服务端
指令
存储器
电子设备
系统为您推荐了相关专利信息
侵权检测方法
时序特征
版权
卷积神经网络模型
语义特征提取
烟叶成熟度
烟叶图像
烟叶数据
识别方法
特征提取能力
模型建立装置
载荷工况
轨道车辆零部件
轨道车辆设计技术
变量