一种基于多模态大模型的视频转漫画方法

AITNT
正文
推荐专利
一种基于多模态大模型的视频转漫画方法
申请号:CN202510870446
申请日期:2025-06-26
公开号:CN120980296A
公开日期:2025-11-18
类型:发明专利
摘要
本发明公开了一种基于多模态大模型的视频转漫画方法,包括:S1,将输入数据输入到任务分配智能体中并传输到视频摘要智能体中,输出关键帧集合;S2,任务分配智能体将关键帧集合和输入数据传输到图片风格迁移智能体中,对关键帧进行字幕移除和风格迁移,输出目标风格图片集合;S3,任务分配智能体对目标风格图片集合中的每个目标风格图片的图片质量进行审核,得到审核后的集合List;S4,布局生成智能体根据集合List进行页面的行布局和列布局并微调,输出符合图片风格要求的漫画书。本发明的视频转漫画方法将视频定制化地转换为漫画书形式,显著减少观看视频的时间成本,提供高度个性化的漫画生成服务,精准满足多样化需求。
技术关键词
图片 风格 关键帧 多模态 漫画页面 生成智能 视频帧集合 文本 摘要 布局 对象 坐标 索引 字幕 数据 规划 扩展工具
系统为您推荐了相关专利信息
1
多模态超分辨成像探针、成像结构、成像方法及存储介质
超分辨成像探针 短波长 电子倍增电荷耦合器件 载物组件 长波长
2
一种榆黄菇的生长预测模型训练方法、装置及设备
生长预测模型 榆黄菇 样本 形态 数据
3
基于多模态图像融合的SF6气体泄漏检测方法
气体泄漏检测方法 SF6气体泄漏检测 可见光图像 多模态 气体泄漏检测系统
4
医学图像肿瘤异质性检测方法与装置
多模态医学影像 脑胶质瘤 高阶统计量 肿瘤 医学影像设备
5
基于多模态耦合分析的自适应管道振动抑制系统及方法
振动抑制系统 多传感器阵列 特征提取单元 多模态 三轴MEMS加速度计
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号