摘要
本发明公开了一种采用GPT的多语言3D数字人交互方法,包括:1)创建数字人虚幻引擎;2)解析用户输入的语音、文本、图片、文档的多模态问题内容;3)构建多模态内容审查模型审核上述多模态问题;4)将内容审查正常的用户输入调用GPT流式响应获取问题回答;5)对问题回答(文本)智能分句,得到句子队列;6)对文本队列中的每个句子以异步的方式同时调用TTS节点生成语音,建立语音队列;7)对上一步的语音队列异步执行口型动画生成,得到动画队列;8)按顺序同步播放语音和动画,实时呈现交互效果。相比于现有技术,本发明支持多语言和多模型选择,兼容图片、语音和文档等多种模态输入,并实现了多模态内容审查机制。
技术关键词
人交互方法
图片
队列
多语言
多模态
构建交互界面
动画
生成语音
交互系统
超文本传输协议
网址
接口插件
节点
云端
控件
话题
会话
系统为您推荐了相关专利信息
货物定位方法
定位基站
动态规则引擎
电子标签
加权质心定位法
定位预警系统
多模态交互
三维位置信息
信息采集程序
语义特征
土建施工设备
智能监控系统
数字孪生体
识别模块
融合特征