基于图生文大模型的视频智能剪辑方法、装置及设备

正文

推荐专利

申请号：CN202511054204

申请日期：2025-07-30

公开号：CN120881356A

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及大模型技术领域，解决现有技术中的视频剪辑依赖人工进行处理，成本高昂、效率低下等问题，提供了基于图生文大模型的视频智能剪辑方法、装置及设备。该方法包括：对待剪辑的原始视频进行预处理，获取预处理后的若干帧第一视频图像；对各所述第一视频图像进行聚类分析，得到若干个图像集合；将各所述图像集合输入预训练的图生文大模型中，得到各所述图像集合对应的关键标签；将各所述关键标签与预设的用户指令进行比较，根据比较结果，确定各所述图像集合中的目标图像集合作为剪辑完成的目标视频片段。本发明通过大模型实现了对视频内容的智能识别与剪辑，减少了人工工作量，为视频编辑和处理提供可靠的技术支持。

技术关键词

视频智能剪辑方法图像计算机程序指令标签像素点文本颜色视觉特征提取词嵌入模型人工工作量矩阵视频编辑聚类依赖人工频率模块存储器

系统为您推荐了相关专利信息

一种基于生成对抗神经网络的孪生表面建模方法

生成对抗神经网络建模方法系统误差多项式图像

接口转换电路、信号处理方法、设备及芯片

模块接口接口转换电路误差检测单元多媒体时钟

一种基于深度学习的入侵检测系统及方法

入侵检测系统入侵检测方法深度学习网络模型网络流量数据超参数

人类阅读启发式多模态虚假新闻检测方法及系统

文本视觉特征多模态特征图像频域特征提取人类

一种慢性阻塞性肺疾病的医学图像分割方法及系统

慢性阻塞性肺病医学图像分割方法慢性阻塞性肺疾病青蒿素非局部均值滤波

基于图生文大模型的视频智能剪辑方法、装置及设备

站点导航

APP 下载