虚拟数字人驱动方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202410755550

申请日期：2024-06-12

公开号：CN118865997A

公开日期：2024-10-29

类型：发明专利

摘要

本发明涉及计算机视觉技术领域，公开了一种虚拟数字人驱动方法、装置、设备及存储介质。虚拟数字人驱动方法包括：获取虚拟数字人的第一驱动信号，其中，第一驱动信号包括音频帧序列与图片帧序列；将每一音频帧输入训练好的语音编码器进行语音编码，以及将每一图片帧输入训练好的图片编码器进行图片编码；分别将每一帧语音编码和图片编码拼接成一帧输入向量，并将每一帧输入向量输入训练好的扩散模型进行图片解码，输出对应帧输出图像；将当前帧输出图像替换第一驱动信号中的对应图片帧，得到虚拟数字人的第二驱动信号，并基于第二驱动信号驱动虚拟数字人。本发明提升了图像生成质量，进而使虚拟数字人的显示效果更加逼真。

技术关键词

语音编码器图片解码器驱动信号驱动方法时序预测模型音频感知损失函数图像解码器计算机设备人脸特征提取人脸检测器计算机视觉技术

系统为您推荐了相关专利信息

适用于控制力矩陀螺高低速分离控制方法及系统

低速电机高速电机驱动控制力矩陀螺状态反馈控制状态空间方程

一种电生理用光刺激装置

主控芯片刺激装置主控模块驱动信号控制发光模块

慢回弹海绵复合过程的除尘处理系统

除尘总成慢回弹海绵传感器数据采集模块 AI算法抽风除尘

一种电机控制器PWM驱动信号故障监测电路

采样模块故障监测电路 PWM驱动信号电机控制器芯片

一种基于人工智能的校园安全信息化管理方法

信息化管理方法步态特征识别步态特征向量人脸特征向量校园

虚拟数字人驱动方法、装置、设备及存储介质

站点导航

APP 下载