一种驱动说话人面部特征高还原方法、装置

正文

推荐专利

一种驱动说话人面部特征高还原方法、装置

申请号：CN202411436768

申请日期：2024-10-15

公开号：CN118941682A

公开日期：2024-11-12

类型：发明专利

摘要

本发明提供了一种驱动说话人面部特征高还原方法、装置，涉及面部特征还原技术领域，该方法包括三个步骤，获取说话人的15个口腔关键帧，驱动说话人模型，使用wenet提取音频的特征；并且在训练阶段引入关键点损失函。使得该方法在实际使用时，驱动说话人能够保持每一帧画面对原始视频口腔形态的高度还原，并且在静音时段，能够自然闭嘴，保持面部和嘴巴动作的协调。以解决现有技术说话人的口腔与本人的口腔不一致，和失真的问题。

技术关键词

说话人模型关键帧面部特征还原方法视频对齐模块人脸关键点检测音频特征还原装置形态图像编码多边形指标解码模块模型预测值

系统为您推荐了相关专利信息

一种用于Type-C接口的视频信号传输电路

视频信号传输电路视频信号接收芯片无线信号发射电路无线信号接收电路信号编码电路

一种LED屏播控安全管理系统及方法、LED屏

识别神经网络图像还原存储单元管理方法图像局部特征

基于人体分割网络和跌倒分类模型的人员跌倒检测方法

跌倒检测方法人体轮廓分类模型训练标注工具文件夹

一种基于文本特征引导的动态参数调整小样本行为识别方法

文本矩阵参数识别方法视频帧

一种基于轨迹编辑和图像翻译的驾驶场景数据增强方法

驾驶场景数据翻译模型图像编辑交通

一种驱动说话人面部特征高还原方法、装置

站点导航

APP 下载