基于动态时空全尺度特征融合的视频识别方法

AITNT
正文
推荐专利
基于动态时空全尺度特征融合的视频识别方法
申请号:CN202411389738
申请日期:2024-09-30
公开号:CN119516422A
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了一种基于动态时空全尺度特征融合的视频识别方法,包括:获取用于训练深度神经网络模型的视频数据集,所述视频数据集包含多个视频序列,每个视频序列由多个时间帧组成;利用所述视频数据集训练预先定义好的视频识别深度神经网络模型,所述视频识别深度神经网络模型包括并行时空适配器和自提示生成器;将训练好的视频识别深度神经网络模型应用于视频识别任务,输入待识别的视频序列,输出视频的分类预测结果。本发明的优点在于通过并行时空适配器和自提示生成器的协同工作,实现了对视频中动态变化的高效建模,显著提高了视频识别的准确性和鲁棒性,适用于有监督学习、少样本学习和零样本识别等多种视频识别任务。
技术关键词
视频识别方法 深度神经网络模型 训练深度神经网络 适配器 动态 多尺度特征提取 输出特征 样本 随机梯度下降 序列 文本编码器 数据 定义 标签 语义 注意力机制
系统为您推荐了相关专利信息
1
一种电压互感器在线监测装置的绝缘状态评估方法及系统
电压互感器在线监测装置 绝缘状态评估方法 介质损耗角 介质损耗测试仪 设备状态参数
2
图像处理系统、显微镜、机器学习算法和预测核标记方法
图像处理系统 分布式结构 机器学习算法 语义图像分割 训练深度神经网络
3
一种应用于SOC芯片的电压补偿方法及系统
温度检测模块 电源管理集成电路 频率 动态 电压补偿方法
4
基于动态阈值的水体分类与叶绿素a浓度分段反演方法
反演方法 寡营养水体 富营养化水体 分段 反射率数据
5
一种边缘自主诊断的模型迁移方法、设备及介质
模型迁移方法 导航设备 构建环境地图 噪声数据 激光雷达
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号