摘要
本申请涉及图像处理领域,提供了一种多模态行为分析方法、装置、设备及存储介质。该方法包括:切割待分析图像,得到多个待分析子图,相对小的图像尺度既保证检测效果,又消除了完全不存在检测对象的大块区域的干扰,平衡耗时与效果;对多个待分析子图进行特征提取,得到多个局部特征图,从多个局部特征图中,分别获取各检测对象各自的局部特征集,再通过池化各局部特征集,得到各检测对象各自的全局行为特征,基于多视角局部信息重建全局信息,弥补将大尺寸的待分析图像大图切分为小尺寸的待分析子图时带来的信息损失;最终,基于描述特定对象行为的对象行为文本和各检测对象各自的全局行为特征,得到待分析图像中执行特定对象行为的目标对象。
技术关键词
对象检测
多模态
计算机设备
分析方法
文本
对象组
计算机程序产品
切割单元
处理器
分析装置
分析单元
多视角
图像处理
可读存储介质
小尺寸
存储器
标识
系统为您推荐了相关专利信息
光谱图像分类方法
前馈神经网络
多模态特征
注意力机制
多层感知器
教育教学系统
智能教育教学
学生
模块
信息化教室
地下水参数
测井声波
监测子系统
三维实景模型
分布特征
企业信用评价方法
LDA模型
技术对企业
序列特征
数据