一种基于检索的文生视频方法

正文

推荐专利

一种基于检索的文生视频方法

申请号：CN202411054722

申请日期：2024-08-02

公开号：CN119011969A

公开日期：2024-11-22

类型：发明专利

摘要

本发明公开了一种基于检索的文生视频方法，包括：(1)对输入的文本提示P进行文本特征提取，获得语义向量；(2)利用语义向量在文本‑视频库中进行检索，匹配相似的文本‑视频对，选择与输入的文本提示P最相似的参考视频；(3)从参考视频中提取关键帧及其关键区域，并进行运动特征的提取；(4)使用提取的运动特征对预训练的文本‑视频生成模型进行微调；(5)将文本提示P输入到微调后的文本‑视频生成模型中，生成最终视频。利用本发明，可以提高生成视频的运动特征精准度，降低计算成本的同时提升视频的真实性。

技术关键词

视频生成模型语义向量文本运动特征预训练语言模型关键帧关键词核心蒸馏注意力定义时间段时序图片元素图像关系

系统为您推荐了相关专利信息

一种金融领域知识问答方法、装置及设备

神经网络结构情感分析模型知识问答方法文本节点

配电网负荷转供决策方法及系统

负荷转供大语言模型决策方法模型训练模块配电网拓扑结构

一种基于大语言模型的用户需求驱动的分布式供能系统容量配置方法

分布式供能系统大语言模型容量配置方法数值优化算法数学模型

一种语音重构方法、装置、电子设备及存储介质

融合语义编码特征显式语义特征文本视野

文档描述信息生成方法、电子设备、芯片系统及存储介质

文本信息生成方法芯片系统电子设备生成提示信息

一种基于检索的文生视频方法

站点导航

APP 下载