基于统一行为矢量映射的多模态融合实时驱动数字人方法

正文

推荐专利

申请号：CN202510424742

申请日期：2025-04-07

公开号：CN120339477A

公开日期：2025-07-18

类型：发明专利

摘要

本发明涉及一种基于统一行为矢量映射的多模态融合实时驱动数字人方法，属于人机交互技术领域。该方法包括：1)语音、动作、视觉多模态特征提取，采用语言特性‑情感解耦、阶段性动作建模及宏观‑微表情流分析生成输入特征；2)跨模态协同对齐与冲突修正，通过知识图谱约束时序分解、逐粒度交互融合及情境驱动模态主导策略实现高精度融合；3)构建三维行为矢量空间，利用蜂巢网格投影将多模态特征映射至统一坐标，结合坐标‑动作映射表驱动数字人输出。本发明解决了多模态时序对齐困难、特征异构及冲突失控问题，实现自然化、情感化、场景化的实时交互，显著提升数字人的表现力与适应性。

技术关键词

蜂巢网格模态特征多模态矢量映射方法三元组知识库表情特征跨模态运动轨迹分析情感识别方法语音关键词语义特征提取视觉人机交互技术门控循环单元动态稠密光流时序坐标点

系统为您推荐了相关专利信息

基于多模态数据的护理质量管控系统

管控系统编码向量文本线索语义

多模态融合的机器人任务流编排与动态适配方法和系统

动态适配方法实时数据机器人参数适配系统

基站设备告警预警方法及装置

基站设备时间段注意力神经网络模型训练样本数据

基于深度学习的情绪分析与状态预警系统

预警系统多模态情绪语音特征预警模型多层感知机

一种偶联含有索引的PCR引物的微粒及其应用

引物索引微粒序列高通量单细胞

基于统一行为矢量映射的多模态融合实时驱动数字人方法

站点导航

APP 下载