一种基于多模态同步的数字人智能交互与姿态表情合成方法

正文

推荐专利

申请号：CN202510560688

申请日期：2025-04-30

公开号：CN120068923A

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及人工智能技术领域，且公开了一种基于多模态同步的数字人智能交互与姿态表情合成方法，包括：该方法通过多模态采集设备获取语音、表情、姿态数据，经噪声过滤和标准化处理后生成多模态特征序列；采用自注意力机制与时序Transformer对特征进行时间对齐与语义融合，生成多模态同步特征；利用情感驱动生成模型及生成对抗网络优化生成参数，生成自然的表情与姿态序列，并通过边缘计算设备实现实时渲染与输出；基于用户交互数据，持续优化多模态模型及生成参数。本发明提升了交互的实时性与情感表达的真实性，具有高扩展性和自适应优化能力，可广泛应用于虚拟助手、沉浸式体验及远程教育等领域。

技术关键词

时间同步融合特征生成对抗网络架构多模态特征校正算法身体姿态数据消除背景干扰麦克风阵列采集生成参数时间序列形式注意力机制异常信号多模态传感器语义

系统为您推荐了相关专利信息

一种皮带输送机滚筒故障诊断系统及方法

皮带输送机滚筒传感器特征故障诊断方法数据条件生成对抗网络

一种基于边缘信息和粗分割的伪装目标检测方法

集成模块粗略语义边缘检测输出特征

一种物联网数据传输的无线通讯方法及系统

无线通讯方法反馈调节机制频段综合评价指标环境综合指数

一种水质参数反演模型的构建方法

水质模型数据反演模型参数影像

一种堤防管涌险情精准动态风险评估方法

动态风险评估方法堤防风险评估模型多模态特征矩阵

一种基于多模态同步的数字人智能交互与姿态表情合成方法

站点导航

APP 下载