一种采用GPT的多语言3D数字人交互方法

正文

推荐专利

申请号：CN202411520676

申请日期：2024-10-29

公开号：CN119376586B

公开日期：2025-11-28

类型：发明专利

摘要

本发明公开了一种采用GPT的多语言3D数字人交互方法，包括：1)创建数字人虚幻引擎；2)解析用户输入的语音、文本、图片、文档的多模态问题内容；3)构建多模态内容审查模型审核上述多模态问题；4)将内容审查正常的用户输入调用GPT流式响应获取问题回答；5)对问题回答(文本)智能分句，得到句子队列；6)对文本队列中的每个句子以异步的方式同时调用TTS节点生成语音，建立语音队列；7)对上一步的语音队列异步执行口型动画生成，得到动画队列；8)按顺序同步播放语音和动画，实时呈现交互效果。相比于现有技术，本发明支持多语言和多模型选择，兼容图片、语音和文档等多种模态输入，并实现了多模态内容审查机制。

技术关键词

人交互方法图片队列多语言多模态构建交互界面动画生成语音交互系统超文本传输协议网址接口插件节点云端控件话题会话

系统为您推荐了相关专利信息

一种基于电子标签的仓储货物定位方法及系统

货物定位方法定位基站动态规则引擎电子标签加权质心定位法

基于多模态交互的道路报警求助定位预警系统

定位预警系统多模态交互三维位置信息信息采集程序语义特征

基于多模态大语言模型的体育视频解说生成方法及系统

大语言模型体育记忆单元文本音频

多模态交互的智能教育服务系统

教育服务系统手势答案教学多模态交互

火力发电厂土建施工设备智能监控系统

土建施工设备智能监控系统数字孪生体识别模块融合特征

一种采用GPT的多语言3D数字人交互方法

站点导航

APP 下载