摘要
本申请涉及视觉大模型技术领域,具体提供一种基于大模型的视频分类方法、装置、智能设备及存储介质,旨在解决视频分类大模型训练和推理需要花费大量计算资源和时间的问题。为此目的,本申请获取视频分类数据集、第一掩码矩阵以及第二掩码矩阵,基于预先获取的大模型以及分类器构建视频分类模型,利用第一掩码矩阵以及视频分类数据集训练视频分类模型,使用训练后的视频分类模型根据第二掩码矩阵对视频进行分类。本申请实现了减少视频分类模型的计算量,提高训练效率、降低显存占用以及减少训练及推理耗时的目的,解决了视频分类大模型训练和推理需要花费大量计算资源和时间的问题,达到了提高模型鲁棒性和实时性的效果。
技术关键词
视频分类模型
掩码矩阵
视频分类方法
图像块
分类器
智能设备
序列
视频分类装置
数据
处理器通信
可读存储介质
模块
存储器
鲁棒性
视觉
计算机
算法
系统为您推荐了相关专利信息
门控循环单元网络
注意力机制
时序特征
无创方式
分类器
光学遥感图像识别
视觉特征
遥感图像数据
样本
适配器
视频检测方法
注意力机制
特征提取网络
冗余特征
上下文语义信息
智能合约执行
整流单元
节点特征
计算机程序指令
动态插桩技术
驾驶员分心
图像块
编码器模块
多层感知器
注意力