一种基于大模型的多轮语音对话方法及系统

正文

推荐专利

一种基于大模型的多轮语音对话方法及系统

申请号：CN202411591975

申请日期：2024-11-08

公开号：CN119601013A

公开日期：2025-03-11

类型：发明专利

摘要

本发明提供了语音对话技术领域的一种基于大模型的多轮语音对话方法及系统，方法包括：步骤S1、获取大量的中文对话数据，对各所述中文对话数据进行预处理后构建数据集；步骤S2、基于语音识别模块、Gemma模块以及文字转语音模块创建一语音对话模型；步骤S3、通过所述数据集对语音对话模型进行训练；步骤S4、将训练后的所述语音对话模型部署到云服务器，设定所述语音对话模型调用的AP I接口，设定所述AP I接口的身份验证机制；步骤S5、基于所述身份验证机制进行身份验证后，通过所述API接口调用云服务器部署的语音对话模型进行连续的语音对话。本发明的优点在于：极大的提升了多轮语音对话的对话能力。

技术关键词

文字转语音模块语音对话方法身份验证机制语音对话系统语音识别模块数据生成输出文本训练集接口模型训练模块微调技术语音对话技术云服务器置信度阈值字典

一种基于大模型的多轮语音对话方法及系统

站点导航

APP 下载