一种视频生成控制方法及计算机可读存储介质

正文

推荐专利

申请号：CN202510496118

申请日期：2025-04-21

公开号：CN120017931A

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供的一种视频生成控制方法及计算机可读存储介质，应用于计算机技术领域。本发明通过分镜大模型解决分镜脚本结构缺陷，基于参考图像特征约束的图像生成确保分镜图特征的一致性，结合情感化语音合成与动态嘴型对齐实现音画同步，并通过分镜视频提示词指导多主体生成算法提升视频保真度，从而有效解决了现有AIGC技术在影视创作中存在的情感逻辑缺失、分镜图特征一致性差、音频同步困难及视频生成可控性不足等技术难题，提升了视频内容制作的效率和质量。

技术关键词

视频生成控制方法图像脚本语音特征嵌入特征注意力语音编码器文本手部特征韵律特征音频动态可读存储介质音效场景语音识别模型语音同步序列

一种视频生成控制方法及计算机可读存储介质

站点导航

APP 下载