一种故事情节驱动的口述影像生成方法及系统

正文

推荐专利

申请号：CN202510553469

申请日期：2025-04-29

公开号：CN120512585A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种故事情节驱动的口述影像生成方法及系统，其中的方法包括情节驱动的故事解译和基于大语言模型的文本生成两个关键部分。首先，通过情节驱动的故事解译进行视频特征的增强，该部分利用已知的情节要素来深度理解当前视频片段，并结合对相关历史情节的回溯，构建出既包含当前关键信息又与上下文逻辑一致的叙事基础。然后进入基于大语言模型的文本生成，部分接收故事解译阶段处理后的信息，并利用大型语言模型（LLM）强大的文本生成能力，生成符合情节内容、自然流畅且连贯的口述影像叙述文本，并可结合提示工程进行风格控制。本发明通过强化情节理解与优化叙事上下文，并利用大语言模型生成文本，显著提升了口述影像生成的质量。

技术关键词

影像生成方法大语言模型文本视频视觉人物特征事件特征语义影像生成系统记忆音频分类器风格多模态处理器时序生成设备图片序列存储装置

系统为您推荐了相关专利信息

会议纪要生成方法、装置、电子设备及存储介质

会议纪要生成方法任务分配信息文本大语言模型资源分配信息

基于黑板模型协作的音视频在线学习方法

在线学习方法黑板模型索引文本音视频

一种基于自然语言处理的结构化数据生成模型

数据生成模型平台子系统客服自然语言生成结构化数据

数据库故障诊断决策方法、系统及可读存储介质

动态决策树决策方法大语言模型数据库故障生成技术

基于多模态语义信息处理智能对话的政务服务方法及系统

语义信息处理政务服务系统多模态数据采集信息输入设备语义向量

一种故事情节驱动的口述影像生成方法及系统

站点导航

APP 下载