摘要
本发明公开了一种基于参数持续性进化的目标个体行为描述方法,涉及计算机视觉领域,包括:从视频中提取帧,并利用预训练的视觉模型对提取的每帧图像进行特征提取,获得帧特征;使用YOLOv7算法结合StrongSORT算法和OsNet算法对视频中的目标个体进行检测和跟踪,并利用所述视觉模型提取个体特征;利用Deformable Transformer可变形解码器将所述个体特征和所述帧特征结合,生成查询特征;将所述查询特征连接到定位头和字幕生成头,描述目标个体行为,并采用损失函数进行模型优化。本发明解决了现有描述方法无法对视频中以个体为单位进行行为描述的问题。
技术关键词
查询特征
注意力机制
算法
视频帧
解码器
参数
位置提取
计算机视觉
图像
字幕
时间段
多尺度
编码器
广义
尺寸
格式
标签
系统为您推荐了相关专利信息
种子活力检测装置
偏振高光谱
分选仪
移动平台
大行程
高斯滤波器
视频智能分析方法
视频帧
视频智能分析系统
分类识别算法
医疗辅助诊断方法
卷积神经网络模型
医学影像数据
电子病历
正则化方法