一种故事文本合成视频的方法及设备

正文

推荐专利

一种故事文本合成视频的方法及设备

申请号：CN202510359885

申请日期：2025-03-25

公开号：CN120238711A

公开日期：2025-07-01

类型：发明专利

摘要

本申请的目的是提供一种故事文本合成视频的方法及设备，本申请通过将故事文本输入到LLM模型中，并设定所述LLM模型的提示器；对LLM模型基于提示器输出的N个事件提取文本特征，得到N个文本特征；获取初始化的全零图像的图像特征，根据全零图像的图像特征与第一个文本特征确定视频的第一帧后续循环执行步骤：根据前一事件的视频帧的图像特征与当前事件的文本特征确定视频的当前帧，直至确定出视频的第N帧；将第一帧至第N帧进行合并，合成故事视频。从而可以得到语义更加连贯的故事视频。

技术关键词

计算机可读指令视频提示器图像变分自动编码器文本编码器处理器语义解码格式存储器介质

系统为您推荐了相关专利信息

基于改进目标检测网络的飞行目标检测装置、方法、系统及介质

融合特征多尺度特征网络模块特征金字塔网络卫星遥感技术

一种端到端的通用表格内容识别与拆分方法、装置及计算机可读存储介质

拆分方法表格多模态标签结构图像编码器

一种基于人工智能的文档信息识别方法、系统及电子设备

信息识别方法文本检测模型标记节点场景

一种基于视觉图像和激光雷达的宠物看护机器人避障方法

宠物看护机器人伸缩牵引绳避障方法激光雷达机器人底盘

一种覆膜支架自动贴合系统及方法

自动贴合方法贴合系统序列二次规划算法深度卷积神经网络投影定位系统

一种故事文本合成视频的方法及设备

站点导航

APP 下载