一种基于思维链的多模态协同数字人交互方法及相关设备

正文

推荐专利

申请号：CN202510424633

申请日期：2025-04-07

公开号：CN120525042B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种基于思维链的多模态协同数字人交互方法及相关设备，其中方法通过多模态感知模块接收用户输入的语言、动作及文本信号，结合历史对话场景生成思维链驱动的多模态思维链，所述思维链动态绑定语音、动作及表情的时序节点并定义其语义关联；通过实时协同校验机制验证多模态输出的情感一致性、时序连贯性及意图匹配度，触发思维链局部回溯与动态修正；最终驱动数字人按优化后的思维链输出协同化的语音、动作及表情。本发明采用大语言模型生成多模态交互思维链，通过时序化绑定与实时校验机制，实现数字人输出的语义深度协同与动态适应性，解决传统技术中多模态割裂、意图匹配偏差及响应僵化问题，显著提升交互拟真度与场景鲁棒性。

技术关键词

人交互方法执行用户意图生成数字人语义标签文本生成自然语言校验机制大语言模型跨模态关键词计算机程序产品生成规则姿态估计算法多模态交互语音识别技术场景

系统为您推荐了相关专利信息

一种基于多模态融合的心血管疾病预测系统

心血管疾病预测多模态信号处理模块大语言模型损失函数优化

面向电力系统软件漏洞检测的代码多模态融合表示学习方法

交互特征学习方法漏洞文本电力

一种用于图书出版行业的数据治理方法

图书数据治理方法字段深度学习模型数据治理技术

一种智能营销内容生成与优化系统

数据采集模块闭环反馈机制多语种语音多模态合规性

一种基于大模型在电力市场智能客服上的应用方法及装置

话题智能客服注意力电力数据

一种基于思维链的多模态协同数字人交互方法及相关设备

站点导航

APP 下载