摘要
本发明涉及视频剪辑技术领域,解决了现有技术中未涉及如何得到视频片段的问题,提供了一种基于多模态大模型的视频剪辑方法、装置、设备及介质,通过获取用户输入的图像描述信息和待剪辑视频;根据所述图像描述信息对所述待剪辑视频进行语义分割,得到所述待剪辑视频中的多个初始分割片段;针对每个初始分割片段中的每个初始边界帧,若所述待剪辑视频中存在与所述初始边界帧相邻且未被包含于所述初始分割片段内的相邻视频帧,则根据所述相邻视频帧与所述初始边界帧,得到目标边界帧;根据所述初始分割片段中的两个目标边界帧,确定所述待剪辑视频中的目标视频片段。能够实现边界的动态调整和优化,从而精确确定视频中的目标视频片段。
技术关键词
图像视觉特征向量
视频帧
视频剪辑方法
计算机程序指令
多模态
视频剪辑技术
视频剪辑装置
时间序列关系
语义
文本
处理器
可读存储介质
模块
关键词
存储器
编码
电子设备
系统为您推荐了相关专利信息
机数据库
能耗预测方法
随机噪声
检测传感器
计算机程序产品
心理健康评估系统
生理特征数据
面部特征
情感特征
多模态特征融合
异构感知数据
决策
场景知识图谱
数据处理单元
融合策略
资产评估系统
工业现场移动终端
分析计算技术
融合多模态特征
行业景气指数