摘要
本发明公开了面向康养领域的大模型对话生成方法及系统,属于人工智能技术领域,要解决的技术问题为对于康养领域、如何基于人工智能生成逼真的虚拟数字人。包括如下步骤:采集对话双方的语音得到音频数据,将音频数据转换为文本数据并将文本数据整理为对话格式;将对话格式的文本文档分解为多个数据块,对于用户输入的查询信息,基于数据块、通过RAG模型生成与查询信息匹配的应答文本;对于与查询信息匹配的应答文本,通过声音克隆技术GPT‑SoVITS生成与原始说话者声音逼真的语音,并将语音导出得到音频文件;基于原始说话者的人脸图像以及音频文件、通过3D混合模型生成说话人脸视频。
技术关键词
文本
对话生成方法
数据
对话生成系统
对话知识库
音频
个性化语音
声音克隆技术
背景噪声
人脸模型
姿态估计
语义特征提取
打标工具
生成提示词
格式
拾音设备
样本
系统为您推荐了相关专利信息
机动车
交通拥堵检测方法
轨迹
中心服务器
挖掘算法
冷却液循环系统
功率控制系统
牵引变流器
水冷系统
试验装置
工业循环水系统节能
序列
随机森林模型
冷却塔
数据