摘要
本发明公开了一种基于多模态大模型的视频转漫画方法,包括:S1,将输入数据输入到任务分配智能体中并传输到视频摘要智能体中,输出关键帧集合;S2,任务分配智能体将关键帧集合和输入数据传输到图片风格迁移智能体中,对关键帧进行字幕移除和风格迁移,输出目标风格图片集合;S3,任务分配智能体对目标风格图片集合中的每个目标风格图片的图片质量进行审核,得到审核后的集合List;S4,布局生成智能体根据集合List进行页面的行布局和列布局并微调,输出符合图片风格要求的漫画书。本发明的视频转漫画方法将视频定制化地转换为漫画书形式,显著减少观看视频的时间成本,提供高度个性化的漫画生成服务,精准满足多样化需求。
技术关键词
图片
风格
关键帧
多模态
漫画页面
生成智能
视频帧集合
文本
摘要
布局
对象
坐标
索引
字幕
数据
规划
扩展工具
系统为您推荐了相关专利信息
超分辨成像探针
短波长
电子倍增电荷耦合器件
载物组件
长波长
气体泄漏检测方法
SF6气体泄漏检测
可见光图像
多模态
气体泄漏检测系统
多模态医学影像
脑胶质瘤
高阶统计量
肿瘤
医学影像设备
振动抑制系统
多传感器阵列
特征提取单元
多模态
三轴MEMS加速度计