基于语音同步的嘴形动作生成方法

AITNT
正文
推荐专利
基于语音同步的嘴形动作生成方法
申请号:CN202511147785
申请日期:2025-08-15
公开号:CN120932671A
公开日期:2025-11-11
类型:发明专利
摘要
本发明公开了基于语音同步的嘴形动作生成方法,属于语音同步技术领域,该生成方法具体步骤如下:Ⅰ:采集并预处理多组视频语料数据,同时建立包含生成模型与判别模型的对抗网络;Ⅱ:依据预处理后的视频语料数据,构造生成模型的输入,并通过生成模型获取各输入对应的预测图像;Ⅲ:依据预测图像,构造判别模型的输入,并通过判别模型判断真实视频与预测图像的差异;本发明能够提高语音嘴形同步的准确率,并且减少怪异嘴形状态的出现概率,实现了中文语音方面,更加准确的嘴形同步。
技术关键词
动作生成方法 语音特征 语音同步 动态图像序列 样本 实时语音 生成预测图像 视觉特征 视频帧 人脸检测算法 网络 画面 数据 中间层 注意力机制
系统为您推荐了相关专利信息
1
基于多维度动态聚合的风储协同调频方法及其应用
调频方法 风电机组 虚拟惯量 风机转速 样本
2
一种基于联合梯度下降的污水处理多水质并行智能预测方法
多任务 智能预测方法 水质 二沉池出水 数据
3
基于分级匹配引导特征增强网络的小样本RGB-T分割方法和系统
分割方法 混合器模块 注意力机制 样本 查询特征
4
风电站风电功率的确定方法、装置和计算机可读存储介质
风电站 样本 时间段 预测模型训练 风速
5
一种基于鲸鱼优化算法与双向长短时记忆网络相结合的煤气预测方法
鲸鱼优化算法 煤气 BiLSTM模型 最佳参数组合 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号