基于预训练大模型自适应静态增强的视频片段定位方法

正文

推荐专利

申请号：CN202510040907

申请日期：2025-01-10

公开号：CN120126042A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种基于预训练大模型自适应静态增强的视频片段定位方法，首先构建训练样本集，构建视频片段定位模型，先根据动态查询生成静态查询，再分别编码得到动态查询特征和静态查询特征，对视频进行分割后编码得到视频特征，采用基于记忆增强的动态静态交互机制对以上特征进行融合，得到动态交互特征和动态‑静态交互特征，先推理得到时刻查询和初始预测时间段，然后采用根据动态交互特征、动态‑静态交互特征和时刻查询对初始预测时间段进行微调，生成最终的预测时间段，采用训练样本集对视频片段定位模型，采用训练好的视频片段定位模型进行视频片段定位。本发明可以显著提升视频片段定位的准确率。

技术关键词

交互特征视频片段定位方法时间段查询特征文本编码器解码器动态标识符交叉注意力机制模块语义特征矩阵交互机制训练样本集参数记忆描述符

系统为您推荐了相关专利信息

一种光伏电站的开发方法和相关装置

光伏电站风险开发方法数值因子

混凝土温度场重构方法、系统、电子设备和存储介质

混凝土温度场 LSTM模型重构方法温度场重构 DNN模型

养殖工船最小定位功率艏向方法、装置、设备、介质及程序产品

参数神经网络模型训练 BP神经网络模型功率养殖工船技术

基于多模态交互的导航路线规划方法及装置

交通拥堵状态导航路线规划方法多模态交互路段车辆

资源调度系统、方法、装置、设备、介质及产品

存储器子模块资源调度系统基板管理控制器资源调度方法

基于预训练大模型自适应静态增强的视频片段定位方法

站点导航

APP 下载