摘要
本发明公开了一种基于高低频特征融合的视频生成方法,属于视频处理领域。低频特征提取:通过全局特征提取器从参考图像中提取低频信息,低频信息包括图像的整体结构、轮廓以及核心关键点图,在模型训练过程中,从输入视频中随机选取某一帧作为参考图像,提取该帧的高频特征和低频特征,并分别注入模型的指定位置;采用扩散模型进行视频生成,通过加噪和去噪的方法优化模型训练过程。本发明通过分别注入低频特征和经过人脸识别提取并融合的人脸高频特征,使得视频中人物的面部特征及整体细节得以保持一致,从而显著提升生成视频的真实感与连贯性。
技术关键词
视频生成方法
高频特征
人脸特征
人脸识别模型
全局特征提取
注意力
深度学习方法
多层感知机
视频生成模型
变换器
边缘检测
图像分割方法
深度学习算法
预训练模型
关键点
噪声特征
面部特征
物体
系统为您推荐了相关专利信息
生命体征监测方法
非接触式生命体征
识别监测技术
多光谱成像仪
心率