摘要
本发明公开了一种采用GPT的多语言3D数字人交互方法,包括:1)创建数字人虚幻引擎;2)解析用户输入的语音、文本、图片、文档的多模态问题内容;3)构建多模态内容审查模型审核上述多模态问题;4)将内容审查正常的用户输入调用GPT流式响应获取问题回答;5)对问题回答(文本)智能分句,得到句子队列;6)对文本队列中的每个句子以异步的方式同时调用TTS节点生成语音,建立语音队列;7)对上一步的语音队列异步执行口型动画生成,得到动画队列;8)按顺序同步播放语音和动画,实时呈现交互效果。相比于现有技术,本发明支持多语言和多模型选择,兼容图片、语音和文档等多种模态输入,并实现了多模态内容审查机制。
技术关键词
人交互方法
图片
队列
多语言
多模态
构建交互界面
动画
生成语音
交互系统
超文本传输协议
网址
接口插件
节点
云端
控件
话题
会话
系统为您推荐了相关专利信息
识别系统
模型驱动方式
样本
电磁信号识别
生成结构化数据
智能管理系统
嵌入式存储芯片
密钥生成单元
通信模块
集成量子光学
模型调度方法
节点
贪心算法
评估设备
梯度提升决策树