基于动态时空全尺度特征融合的视频识别方法

正文

推荐专利

申请号：CN202411389738

申请日期：2024-09-30

公开号：CN119516422A

公开日期：2025-02-25

类型：发明专利

摘要

本发明公开了一种基于动态时空全尺度特征融合的视频识别方法，包括：获取用于训练深度神经网络模型的视频数据集，所述视频数据集包含多个视频序列，每个视频序列由多个时间帧组成；利用所述视频数据集训练预先定义好的视频识别深度神经网络模型，所述视频识别深度神经网络模型包括并行时空适配器和自提示生成器；将训练好的视频识别深度神经网络模型应用于视频识别任务，输入待识别的视频序列，输出视频的分类预测结果。本发明的优点在于通过并行时空适配器和自提示生成器的协同工作，实现了对视频中动态变化的高效建模，显著提高了视频识别的准确性和鲁棒性，适用于有监督学习、少样本学习和零样本识别等多种视频识别任务。

技术关键词

视频识别方法深度神经网络模型训练深度神经网络适配器动态多尺度特征提取输出特征样本随机梯度下降序列文本编码器数据定义标签语义注意力机制

系统为您推荐了相关专利信息

一种电压互感器在线监测装置的绝缘状态评估方法及系统

电压互感器在线监测装置绝缘状态评估方法介质损耗角介质损耗测试仪设备状态参数

图像处理系统、显微镜、机器学习算法和预测核标记方法

图像处理系统分布式结构机器学习算法语义图像分割训练深度神经网络

一种应用于SOC芯片的电压补偿方法及系统

温度检测模块电源管理集成电路频率动态电压补偿方法

基于动态阈值的水体分类与叶绿素a浓度分段反演方法

反演方法寡营养水体富营养化水体分段反射率数据

一种边缘自主诊断的模型迁移方法、设备及介质

模型迁移方法导航设备构建环境地图噪声数据激光雷达

基于动态时空全尺度特征融合的视频识别方法

站点导航

APP 下载