基于语音同步的嘴形动作生成方法

正文

推荐专利

基于语音同步的嘴形动作生成方法

申请号：CN202511147785

申请日期：2025-08-15

公开号：CN120932671A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了基于语音同步的嘴形动作生成方法，属于语音同步技术领域，该生成方法具体步骤如下：Ⅰ：采集并预处理多组视频语料数据，同时建立包含生成模型与判别模型的对抗网络；Ⅱ：依据预处理后的视频语料数据，构造生成模型的输入，并通过生成模型获取各输入对应的预测图像；Ⅲ：依据预测图像，构造判别模型的输入，并通过判别模型判断真实视频与预测图像的差异；本发明能够提高语音嘴形同步的准确率，并且减少怪异嘴形状态的出现概率，实现了中文语音方面，更加准确的嘴形同步。

技术关键词

动作生成方法语音特征语音同步动态图像序列样本实时语音生成预测图像视觉特征视频帧人脸检测算法网络画面数据中间层注意力机制

系统为您推荐了相关专利信息

基于多维度动态聚合的风储协同调频方法及其应用

调频方法风电机组虚拟惯量风机转速样本

一种基于联合梯度下降的污水处理多水质并行智能预测方法

多任务智能预测方法水质二沉池出水数据

基于分级匹配引导特征增强网络的小样本RGB-T分割方法和系统

分割方法混合器模块注意力机制样本查询特征

风电站风电功率的确定方法、装置和计算机可读存储介质

风电站样本时间段预测模型训练风速

一种基于鲸鱼优化算法与双向长短时记忆网络相结合的煤气预测方法

鲸鱼优化算法煤气 BiLSTM模型最佳参数组合数据

基于语音同步的嘴形动作生成方法

站点导航

APP 下载