基于扩散模型的视频卸妆方法及装置

正文

推荐专利

基于扩散模型的视频卸妆方法及装置

申请号：CN202510945921

申请日期：2025-07-09

公开号：CN120931747A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种基于扩散模型的视频卸妆方法及装置，其包括：构建有妆‑无妆视频数据对；对无妆视频的视频帧进行人脸识别得到人脸五官信息，并基于人脸五官信息生成mask图像；对无妆视频的视频帧添加文本描述提示词；构建基于交叉注意力机制的扩散模型；将当前有妆视频帧、上一无妆视频帧、mask图像和文本描述提示词作为扩散模型的输入，经过交叉注意力计算，输出当前有妆视频帧对应的无妆视频帧，得到当前有妆视频的卸妆结果；该方法利用扩散模型的条件生成能力，通过独特设计的交叉注意力机制引入帧间依赖关系和提示控制信息，进一步优化扩散模型，提高了卸妆视频的连贯性，实现高质量的视频卸妆效果。

技术关键词

卸妆方法交叉注意力机制视频帧人脸五官文本卷积编码器去噪模型噪声预测图像重建轮廓区域融合策略时序基线处理器计算方法

基于扩散模型的视频卸妆方法及装置

站点导航

APP 下载