摘要
本申请公开了一种基于图像数据的设定行为识别方法及装置。方法包括:对图像采集单元采集的视频帧进行周期采样,获得采样视频数据;对采样视频数据进行对象识别,将采样视频数据中包含设定对象、且设定对象数量大于等于设定阈值的视频数据,作为有效视频数据;选用相应的视觉处理模型以及自然语言处理型;为所述视觉处理模型生成多模态内容分析的提示语句;利用所述视觉处理模型对有效视频数据进行文本描述,为有效视频数据生成图像字幕;将所述图像字幕输入相应处理模型,以确定所述有效视频数据中是否存在设定行为,并确定存在设定行为的概率,输出所确定的概率。本申请减少了视频帧中特定行为的误判,节省了大量的处理资源。
技术关键词
局部特征信息
数据生成图像
字幕
识别方法
多模态
对象识别
图像采集单元
识别装置
自然语言
视频帧
视觉
语句
文本
算法
周期
变量
系统为您推荐了相关专利信息
唇动特征
气流
视觉特征提取
唇语识别方法
融合特征
异常检测方法
卷积模块
传感器节点
归一化模块
离散小波变换
网络访问数据
风险识别方法
异常事件
时序特征
计算机可执行指令
眼动轨迹
波前像差数据
角膜地形图
生成对抗网络
多模态数据融合