基于兴趣点的单图生成视频方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411874264

申请日期：2024-12-18

公开号：CN119788935A

公开日期：2025-04-08

类型：发明专利

摘要

本发明提供了基于兴趣点的单图生成视频方法、系统、设备及存储介质，该方法包括：采集兴趣点的海量视频；对海量视频进行预处理，将预处理后的视频作为训练数据集，并使用大语言模型进行视频描述生成语言描述信息；基于视频和语言描述信息训练图生视频大模型，在图生视频大模型中视频至少被拆分为若干视频帧；获得兴趣点的目标图片；将目标图片输入经过训练的图生视频大模型，识别目标图片中的对象，并获得基于图片的语言描述信息，语言描述信息至少包括图片中识别的对象、各对象之间的空间位置和相机运动轨迹，从而生成一兴趣点展示视频。本发明能够实现单张图像快速生成动效视频，大幅减少人力成本，优化酒店、景点等内容展示，提升用户体验。

技术关键词

图片大语言模型对象兴趣点文本编码器视频解码器视频编码器视频帧视频输出模块相机轨迹视频采集模块模型训练模块酒店房间运动视频系统视频设备处理器

系统为您推荐了相关专利信息

一种基于CylinderTag视觉标签的引流线夹位姿估计方法

估计方法引流线夹四边形表面粘贴标签视觉

一种用于健康监测的咳嗽声音识别方法

咳嗽声音识别方法 MFCC特征融合特征音频声音特征提取

脓毒症相关疾病生物标志物HLA-DQA及其用途

疾病早期诊断疾病生物标志物对象脓毒症生物标志物蛋白质芯片试剂盒

基于对抗学习的种群鉴别模型训练方法、系统及存储介质

模型训练方法建立分类模型计算机存储介质构建测试数据数据采集模块

基于大语言模型的参数提取方法、装置及存储介质

大语言模型参数提取方法数据语义特征参数提取装置

基于兴趣点的单图生成视频方法、系统、设备及存储介质

站点导航

APP 下载