一种基于动作快慢特征的多模态鸟类动作识别方法及装置

AITNT
正文
推荐专利
一种基于动作快慢特征的多模态鸟类动作识别方法及装置
申请号:CN202510034605
申请日期:2025-01-09
公开号:CN119964238A
公开日期:2025-05-09
类型:发明专利
摘要
本发明公开了一种基于动作快慢特征的多模态鸟类动作识别方法及装置,该方法包括:计算输入视频相邻两帧图像之间的光流运动矢量;将光流运动矢量值按照区间进行划分,得到多个快慢类别;将每个快慢类别转化为一个二进制向量,得到动作快慢特征;将动作快慢特征与视觉‑文本特征相融合,共同作为模型的语义查询部分;训练模型:将语义查询部分与视频特征向量均输入解码器,解码器利用语义查询部分对解码器进行引导,使解码器能够聚焦于与语义查询部分的信息进行解码,得到动作识别结果,计算动作识别结果的平均精度均值,平均精度均值作为评价训练效果的指标。本发明能够更好地捕捉到鸟类动作中的时间动态信息,具有更高的识别准确性和鲁棒性。
技术关键词
动作识别方法 视频特征向量 动作识别装置 语义 文本编码器 相邻两帧图像 输入解码器 文本特征向量 光流方程 视频编码器 转换单元 运动 像素点 视觉
系统为您推荐了相关专利信息
1
基于点注释扩展网络的遥感图像语义分割方法和装置
遥感图像语义分割 遥感图像数据 分支 水平垂直翻转 更新网络参数
2
淋巴水肿肢体体积测量数据管理系统及方法
淋巴水肿肢体体积 模式特征向量 多模态 语义 序列
3
一种交通事故地址解析方法、装置、设备及介质
地址解析方法 语义 字符 XGBoost算法 矩阵
4
一种基于人工智能的工业图像变化异常检测方法及系统
异常检测方法 二维快速傅里叶变换 重建误差 双线性插值 工业
5
一种基于知识图谱的链路预测方法
三元组 链路预测方法 实体 图谱 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号