虚拟数字人驱动方法、装置、设备及存储介质

AITNT
正文
推荐专利
虚拟数字人驱动方法、装置、设备及存储介质
申请号:CN202410755550
申请日期:2024-06-12
公开号:CN118865997A
公开日期:2024-10-29
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,公开了一种虚拟数字人驱动方法、装置、设备及存储介质。虚拟数字人驱动方法包括:获取虚拟数字人的第一驱动信号,其中,第一驱动信号包括音频帧序列与图片帧序列;将每一音频帧输入训练好的语音编码器进行语音编码,以及将每一图片帧输入训练好的图片编码器进行图片编码;分别将每一帧语音编码和图片编码拼接成一帧输入向量,并将每一帧输入向量输入训练好的扩散模型进行图片解码,输出对应帧输出图像;将当前帧输出图像替换第一驱动信号中的对应图片帧,得到虚拟数字人的第二驱动信号,并基于第二驱动信号驱动虚拟数字人。本发明提升了图像生成质量,进而使虚拟数字人的显示效果更加逼真。
技术关键词
语音编码器 图片解码器 驱动信号 驱动方法 时序预测模型 音频 感知损失函数 图像解码器 计算机设备 人脸特征提取 人脸检测器 计算机视觉技术
系统为您推荐了相关专利信息
1
适用于控制力矩陀螺高低速分离控制方法及系统
低速电机 高速电机驱动 控制力矩陀螺 状态反馈控制 状态空间方程
2
一种电生理用光刺激装置
主控芯片 刺激装置 主控模块 驱动信号 控制发光模块
3
慢回弹海绵复合过程的除尘处理系统
除尘总成 慢回弹海绵 传感器数据采集模块 AI算法 抽风除尘
4
一种电机控制器PWM驱动信号故障监测电路
采样模块 故障监测电路 PWM驱动信号 电机控制器 芯片
5
一种基于人工智能的校园安全信息化管理方法
信息化管理方法 步态特征识别 步态特征向量 人脸特征向量 校园
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号