一种基于多模态大模型的视频转漫画方法

正文

推荐专利

一种基于多模态大模型的视频转漫画方法

申请号：CN202510870446

申请日期：2025-06-26

公开号：CN120980296A

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于多模态大模型的视频转漫画方法，包括：S1，将输入数据输入到任务分配智能体中并传输到视频摘要智能体中，输出关键帧集合；S2，任务分配智能体将关键帧集合和输入数据传输到图片风格迁移智能体中，对关键帧进行字幕移除和风格迁移，输出目标风格图片集合；S3，任务分配智能体对目标风格图片集合中的每个目标风格图片的图片质量进行审核，得到审核后的集合List；S4，布局生成智能体根据集合List进行页面的行布局和列布局并微调，输出符合图片风格要求的漫画书。本发明的视频转漫画方法将视频定制化地转换为漫画书形式，显著减少观看视频的时间成本，提供高度个性化的漫画生成服务，精准满足多样化需求。

技术关键词

图片风格关键帧多模态漫画页面生成智能视频帧集合文本摘要布局对象坐标索引字幕数据规划扩展工具

系统为您推荐了相关专利信息

多模态超分辨成像探针、成像结构、成像方法及存储介质

超分辨成像探针短波长电子倍增电荷耦合器件载物组件长波长

一种榆黄菇的生长预测模型训练方法、装置及设备

生长预测模型榆黄菇样本形态数据

基于多模态图像融合的SF6气体泄漏检测方法

气体泄漏检测方法 SF6气体泄漏检测可见光图像多模态气体泄漏检测系统

医学图像肿瘤异质性检测方法与装置

多模态医学影像脑胶质瘤高阶统计量肿瘤医学影像设备

基于多模态耦合分析的自适应管道振动抑制系统及方法

振动抑制系统多传感器阵列特征提取单元多模态三轴MEMS加速度计

一种基于多模态大模型的视频转漫画方法

站点导航

APP 下载