摘要
本发明公开了一种大模型驱动的数字人实时交互方法,涉及数字人技术领域,包括如下步骤:S1、通过人机对话前端输入提问文本并发送至大模型后端;S2、大模型后端根据提问文本和知识库进行大模型推理,生成答案摘要和完整答案分别发至数字人后端和人机对话前端进行展示;S3、分类器根据答案摘要生成多个分类标签;数字人后端根据分类标签对预置视频库进行检索匹配,获得目标预置视频,并发送至人机对话前端;S4、数字人处理引擎根据答案摘要生成数字人摘要视频,并将视频推流至播放器;播放器依次播放目标预置视频和数字人摘要视频。最终实现更为流畅的数字人实时问答交互体验,减少失真体验。
技术关键词
摘要
交互方法
生成数字人
视频库
播放器
生成答案
文本
标签
语义分类器
序列
音频
分段
系统为您推荐了相关专利信息
历史交互信息
大语言模型
文本
语音交互方法
输出交互信息
关键词提取方法
大语言模型
文本关键词提取
自然语言
多义词