摘要
本发明提供一种基于检索增强生成的语音问答方法、系统、介质及产品,其中,该方法包括:获取待处理音频和与待处理音频对应的原始问题;通过预先设置的ASR模型转录待处理音频,得到文本转录结果;将文本转录结果、原始问题和第一预设提示词输入到第一大语言模型,得到第一大语言模型输出的与待处理音频对应的关键问题;第一预设提示词用于提示第一大语言模型根据文本转录结果和原始问题生成对应的关键问题;基于检索增强生成技术,通过访问外部的搜索引擎搜索关键问题,得到语义相关的多个段落;将语义相关的多个段落、关键问题、第二预设提示词输入到第二大语言模型,得到目标答案。本发明可以提高语音问答任务的处理效果,方便部署和维护。
技术关键词
大语言模型
语音问答方法
音频
文本
生成技术
答案
语音问答系统
语义
模块
计算机程序产品
数据
背景噪声
样本
可读存储介质
处理器
指令
在线
系统为您推荐了相关专利信息
查询特征
重识别方法
多模态特征
ROI图像
文本特征向量
文本
异常检测方法
大语言模型
训练集
神经网络模型
频谱特征
音频编码方法
编码器
编码结构
生成对抗网络