摘要
本发明涉及大模型技术领域,解决现有技术中的视频剪辑依赖人工进行处理,成本高昂、效率低下等问题,提供了基于图生文大模型的视频智能剪辑方法、装置及设备。该方法包括:对待剪辑的原始视频进行预处理,获取预处理后的若干帧第一视频图像;对各所述第一视频图像进行聚类分析,得到若干个图像集合;将各所述图像集合输入预训练的图生文大模型中,得到各所述图像集合对应的关键标签;将各所述关键标签与预设的用户指令进行比较,根据比较结果,确定各所述图像集合中的目标图像集合作为剪辑完成的目标视频片段。本发明通过大模型实现了对视频内容的智能识别与剪辑,减少了人工工作量,为视频编辑和处理提供可靠的技术支持。
技术关键词
视频智能剪辑方法
图像
计算机程序指令
标签
像素点
文本
颜色
视觉特征提取
词嵌入模型
人工工作量
矩阵
视频编辑
聚类
依赖人工
频率
模块
存储器
系统为您推荐了相关专利信息
生成对抗神经网络
建模方法
系统误差
多项式
图像
模块接口
接口转换电路
误差检测单元
多媒体
时钟
入侵检测系统
入侵检测方法
深度学习网络模型
网络流量数据
超参数
文本
视觉特征
多模态特征
图像频域特征提取
人类
慢性阻塞性肺病
医学图像分割方法
慢性阻塞性肺疾病
青蒿素
非局部均值滤波