一种基于多模型协作的图生视频及配乐的方法及系统

正文

推荐专利

申请号：CN202410864642

申请日期：2024-07-01

公开号：CN118782045A

公开日期：2024-10-15

类型：发明专利

摘要

本发明公开了一种基于多模型协作的图生视频及配乐的方法及系统，该方法首先利用图生文大模型对图片信息进行解析与理解，将其转换为语言和文字。随后，通过文生文大模型将图片表达的文字信息生成有条理的故事，再利用文生视频大模型将故事信息转化为视频。视频生成后，通过解构和抽取算法，从视频中抽取关键帧，并使用图生文模型进行情感分析，最终结合文生音乐大模型生成配乐。本发明提供了一种将单张图片转换为具有连贯情节和配乐的视频文件的方法，大幅降低了视频创作的技术门槛，推动了UGC内容创作的普及。此外，本发明还包括一个用户友好的APP、电脑网页和微信小程序系统，方便用户多途径使用该技术。

技术关键词

抽取算法视频识别关键帧转移概率矩阵序列关系型数据库管理系统多模型马尔可夫链模型图片长短期记忆网络文本风格后处理模块音乐特征程序系统情感词典支持向量机

系统为您推荐了相关专利信息

一种面向自动驾驶仿真安全测试方法及装置

显卡服务器测试方法任务调度参数

基于Swin-Transformer和YOLOv8融合检测算法的高空抛物检测方法

高空抛物检测方法序列图像块特征局部细节特征线性变换矩阵

基于水下相机及水听器的运行目标声信号采集系统

水听器信号采集系统水下相机叠加特征干扰特征

一种基于图神经网络的供应链风险预测方法和装置

深度神经网络模型风险预测方法拓扑图风险预测装置序列数据处理

一种基于多维度信息披露的电商信用监督方法及系统

电商决策树模型文本时间差评价检测系统

一种基于多模型协作的图生视频及配乐的方法及系统

站点导航

APP 下载