摘要
本发明公开了一种基于动态时空全尺度特征融合的视频识别方法,包括:获取用于训练深度神经网络模型的视频数据集,所述视频数据集包含多个视频序列,每个视频序列由多个时间帧组成;利用所述视频数据集训练预先定义好的视频识别深度神经网络模型,所述视频识别深度神经网络模型包括并行时空适配器和自提示生成器;将训练好的视频识别深度神经网络模型应用于视频识别任务,输入待识别的视频序列,输出视频的分类预测结果。本发明的优点在于通过并行时空适配器和自提示生成器的协同工作,实现了对视频中动态变化的高效建模,显著提高了视频识别的准确性和鲁棒性,适用于有监督学习、少样本学习和零样本识别等多种视频识别任务。
技术关键词
视频识别方法
深度神经网络模型
训练深度神经网络
适配器
动态
多尺度特征提取
输出特征
样本
随机梯度下降
序列
文本编码器
数据
定义
标签
语义
注意力机制
系统为您推荐了相关专利信息
电压互感器在线监测装置
绝缘状态评估方法
介质损耗角
介质损耗测试仪
设备状态参数
图像处理系统
分布式结构
机器学习算法
语义图像分割
训练深度神经网络
温度检测模块
电源管理集成电路
频率
动态
电压补偿方法
反演方法
寡营养水体
富营养化水体
分段
反射率数据
模型迁移方法
导航设备
构建环境地图
噪声数据
激光雷达