摘要
本发明适用于视频处理技术领域,提供了一种长视频中特定事件的定位方法及系统。本发明通过构建轻量化模型,并进行本地部署;在能直接使用轻量化模型时,直接获取本地定位结果;在不能直接使用轻量化模型时,使用多模态大模型进行辅助推理,获取辅助定位结果,并对轻量化模型进行反哺升级。能够在能直接使用轻量化模型时,直接获取本地定位结果;在不能直接使用轻量化模型时,使用远端的多模态大模型进行辅助推理,并对轻量化模型进行反哺升级,从而将轻量化模型与多模态大模型进行有效的协同融合,在提升长视频中特定事件的定位能力的同时,也能利用多模态大模型的推理结果,实现本地部署的轻量化模型的自我升级,达到越用越好用的效果。
技术关键词
视频
多模态
定位方法
记忆
训练集
定位系统
终端设备
展示界面
学习算法
模块
重构单元
数据
记录单元
精度
动态
聚类
系统为您推荐了相关专利信息
自动标记方法
会议管理终端
身份
会议管理系统
生物特征码
多模态特征
数据处理方法
融合特征
计算机程序产品
特征提取模块
高光谱反演方法
蓝莓
拉普拉斯
广义特征值
多项式核函数