基于低算力设备的3D数字人多模态实时驱动方法及系统

正文

推荐专利

申请号：CN202510614277

申请日期：2025-05-13

公开号：CN120510257A

公开日期：2025-08-19

类型：发明专利

摘要

本发明提出了一种基于低算力设备的3D数字人多模态实时驱动方法及系统，涉及数字人技术领域，该方法包括：通过3D扫描设备采集3D数字人在各种表情下的原始情感数据集；对原始情感数据集进行预处理，以获取多模态情感数据，并对多模态情感数据进行特征提取，以获取语音特征、唇形特征以及微表情特征；基于多模态情感数据和3D模型空间参数，构建神经辐射场函数，并将神经辐射场函数与知识迁移模型进行跨模态特征对齐，以构建轻量化识别模型；将3D扫描设备采集的实时情感数据传输至轻量化识别模型，获取当前3D数字人的表情驱动信号，并根据表情驱动信号驱动3D数字人执行对应的响应行为。本申请有助于提升3D数字人情感表现的丰富度与自然度。

技术关键词

唇形特征表情特征多模态语音特征驱动方法微表情数据驱动信号扫描设备驱动控制模块语音类别嘴唇轮廓梅尔频率倒谱系数跨模态声学特征数据采集模块网络接口标签前馈神经网络

基于低算力设备的3D数字人多模态实时驱动方法及系统

站点导航

APP 下载