摘要
本发明提供了语音对话技术领域的一种基于大模型的多轮语音对话方法及系统,方法包括:步骤S1、获取大量的中文对话数据,对各所述中文对话数据进行预处理后构建数据集;步骤S2、基于语音识别模块、Gemma模块以及文字转语音模块创建一语音对话模型;步骤S3、通过所述数据集对语音对话模型进行训练;步骤S4、将训练后的所述语音对话模型部署到云服务器,设定所述语音对话模型调用的AP I接口,设定所述AP I接口的身份验证机制;步骤S5、基于所述身份验证机制进行身份验证后,通过所述API接口调用云服务器部署的语音对话模型进行连续的语音对话。本发明的优点在于:极大的提升了多轮语音对话的对话能力。
技术关键词
文字转语音模块
语音对话方法
身份验证机制
语音对话系统
语音识别模块
数据生成输出
文本
训练集
接口
模型训练模块
微调技术
语音对话技术
云服务器
置信度阈值
字典