摘要
本发明公开了一种基于多标签学习的多源素材混合剪辑视频的方法及系统,包括步骤一:最大化近义模糊匹配学习;最大化近义模糊匹配学习旨在将多标签分类问题映射为模糊匹配任务;步骤二:分阶段视频token化;步骤三:视频片段排序策略。本发明提出的学习策略,可以解决多标签分类中一对多的模糊匹配问题,不需要训练多个二分类器即可完成对多标签分类任务的训练,避免了同时训练多个二分类器所产生的损失计算冲突,并且节省了计算资源,本发明提出的视频词元(token)化方法,基于最小类内距离,分阶段完成对视频的token化,生成的视频token词典可接入后续任何tokens‑to‑token的训练任务。
技术关键词
视频
多标签学习
排序策略
分阶段
词典
二分类器
模型预测值
聚类算法
图像
定义
索引
批量
样本
数据
系统为您推荐了相关专利信息
三维动态模型
变电站现场作业
三维动态建模
管控方法
作业现场