一种掩码恢复表观的高分辨率视频重配音生成方法

AITNT
正文
推荐专利
一种掩码恢复表观的高分辨率视频重配音生成方法
申请号:CN202510267673
申请日期:2025-03-07
公开号:CN120388108A
公开日期:2025-07-29
类型:发明专利
摘要
本发明公开了一种掩码恢复表观的高分辨率视频重配音生成方法,包括以下步骤:(1)输入数据与预处理;(2)采用MAE编码器进行掩码重建,推理出面部的结构特征,通过多尺度解码器生成不同分辨率的特征图,结合gating机制使特征与不同输入尺寸的参考帧对齐,捕捉嘴部和眼部等关键区域的静态结构特征;(3)通过参考帧提取纹理特征与生成的结构特征进行融合;同时将驱动音频特征通过跨注意力机制与融合特征结合,生成动态对齐后的纹理特征;采用AdaAT算法实现动态特征的仿射变换,确保嘴部动态与音频同步;(4)生成重配音视频;本发明显著提升生成的稳定性和姿势适应性,实现精确的嘴部与音频同步。
技术关键词
生成方法 卷积解码器 音频特征 音频编码器 语义特征 融合特征 动态纹理特征 交叉注意力机制 音视频 多尺度 面部 图像块
系统为您推荐了相关专利信息
1
一种基于柔性涡流传感器的叶盘检测方法
柔性涡流传感器 FPGA芯片 去噪模型 阵列探头 信号处理模块
2
一种跨境电商防信息泄露订单号生成方法及系统
防信息泄露 标识符 加密 节点 生成方法
3
一种信息安全传输的图像识别与文本还原方法及装置
文本还原方法 还原装置 数据 图片 视频录制设备
4
一种资产分析报告生成方法、设备及介质
分析报告生成方法 支持向量机回归 资产 识别特征 马尔可夫模型
5
视频处理方法、装置、计算机设备和存储介质
视频 融合特征 声纹特征 智能模型 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号