摘要
本发明属于图像识别领域,提出了一种基于多模态群体行为识别技术的交互行为识别方法及系统,通过设计一种多模态群体行为识别网络,包括图像分支子网络、文本分支子网络和关键点分支子网络,分别进行多模态特征处理,以避免通过单一模态信息进行识别时,由于群体间的交互行为和复杂的交互环境的因素,造成识别精度较低的问题,进一步符合实际检修情况,提高了整体识别的精度,又通过轻量化设计,提高了识别的效率,再进行群体之间和群体与交互目标之间的关系和交互增强,进一步的提高了识别的精度,避免了因为遮挡重叠造成的识别障碍,本发明提高了群体目标交互行为的识别准确性和效率。
技术关键词
关键点特征提取
分支
图像
文本
多模态
关系
识别方法
网络
输出特征
子模块
算法
多头注意力机制
增强子
蒸馏
视频
基础
系统为您推荐了相关专利信息
整流器室
智能巡检系统
电磁兼容性检测装置
电磁环境监测
磁场强度传感器
交互数据处理方法
校准电信号
机器人摄像头
机器人移动控制
机械臂