摘要
本发明提出了一种大熊猫进食食物的动态检测方法、系统及检测设备,涉及动态场景检测的技术领域。采集大熊猫进食视频流,对视频流进行采样与预处理,构建DeepSeek‑VL教师‑学生模型,将采样到的关键帧输入到DeepSeek‑VL教师‑学生模型中的DeepSeek‑VL教师子模型中,生成多模态监督信号;基于多模态监督信号,利用知识蒸馏策略对学生子模型进行分阶段训练,在训练过程中,DeepSeek‑VL教师‑学生模型中的学生子模型学习DeepSeek‑VL教师子模型生成的多模态监督信号,在降低计算复杂度的同时,实现模型轻量化部署。利用训练好的DeepSeek‑VL教师‑学生模型对大熊猫进食场景中的食物进行动态检测。本方法增强了对大熊猫进食场景的语义理解能力,提高了目标的检测、追踪与分类的精确度。
技术关键词
动态检测方法
教师
语义特征
学生
时序特征
视频流
关键帧
注意力
热力图
动态检测设备
图像特征提取
蒸馏
表达式
多模态
模块
分阶段
跨尺度特征融合
动态检测系统
系统为您推荐了相关专利信息
日志异常检测方法
语义特征
模板
序列特征
语义向量
负荷
楼宇电子
长短期记忆网络
识别方法
AI摄像头
车轮零部件
多尺度特征
网络模块
输出特征
卷积特征提取
遥感图像变化
文本生成方法
状态空间模型
融合特征
空间金字塔池化