一种基于多标签学习的多源素材混合剪辑视频的方法及系统

正文

推荐专利

申请号：CN202411099090

申请日期：2024-08-12

公开号：CN119052595A

公开日期：2024-11-29

类型：发明专利

摘要

本发明公开了一种基于多标签学习的多源素材混合剪辑视频的方法及系统，包括步骤一：最大化近义模糊匹配学习；最大化近义模糊匹配学习旨在将多标签分类问题映射为模糊匹配任务；步骤二：分阶段视频token化；步骤三：视频片段排序策略。本发明提出的学习策略，可以解决多标签分类中一对多的模糊匹配问题，不需要训练多个二分类器即可完成对多标签分类任务的训练，避免了同时训练多个二分类器所产生的损失计算冲突，并且节省了计算资源，本发明提出的视频词元（token）化方法，基于最小类内距离，分阶段完成对视频的token化，生成的视频token词典可接入后续任何tokens‑to‑token的训练任务。

技术关键词

视频多标签学习排序策略分阶段词典二分类器模型预测值聚类算法图像定义索引批量样本数据

系统为您推荐了相关专利信息

多源数据融合的场景空间模型自适应建模方法

场景建模算法重建误差建模方法策略数据库

线上面签风险评估方法和装置、电子设备、存储介质

语音视频通话数据客户声纹识别模型声纹特征

一种基于YOLO算法和动态分析的烟火检测与分析方法

YOLO算法烟火输出告警信息坐标分析方法

一种基于三维动态建模的变电站现场作业管控方法

三维动态模型变电站现场作业三维动态建模管控方法作业现场

一种远程调试方法

远程调试方法自定义指令重启设备文本客户

一种基于多标签学习的多源素材混合剪辑视频的方法及系统

站点导航

APP 下载