一种人脸一致性多角度镜头视频生成方法、装置

正文

推荐专利

申请号：CN202510658703

申请日期：2025-05-21

公开号：CN120321472A

公开日期：2025-07-15

类型：发明专利

摘要

本发明提供了一种人脸一致性多角度镜头视频生成方法、装置，涉及多角度镜头视频生成技术领域，该方法通过LoRA微调技术对图像生成模型进行个性化调整，从单张照片生成同一人物的多角度多姿态图像序列；利用图像转视频模块将多张图像合成为短视频片段；通过大语言模型(LLM)生成符合语音播报逻辑的文案脚本；最后结合唇形驱动与视频拼接技术，将语音与图像合成并驱动口型动作，拼接多角度镜头为流畅连贯的完整视频。显著提升了口播视频的自动化程度，增强了视频的真实感和视觉丰富度，解决了现有技术生成口播视频时存在镜头单一、流程分散、唇形驱动不连贯以及人工干预多的问题。

技术关键词

多角度视频生成方法视频生成装置图像生成模型镜头人脸开源框架微调单元视频生成技术关键词视频拼接技术脚本序列文本短视频风格主题微调技术

系统为您推荐了相关专利信息

图像生成方法及装置

图像生成模型图像生成方法布局文本检测模型文本识别模型

图文生成方法、图文生成装置、电子设备及存储介质

关键视觉信息图像生成模型图文主题关键词风格

基于多模态大模型的无人机视频摘要语义描述方法及系统

视频帧视频场景分割语义摘要多模态

一种地物目标光谱-成像椭偏装置及其检测方法

可见光相机可见光信号光电信号转换器可见光探测器相机组件

一种多角度调节的机械手

多角度机械手检测台安装件安装台

一种人脸一致性多角度镜头视频生成方法、装置

站点导航

APP 下载