摘要
本发明涉及计算机视觉技术领域,特别是涉及一种基于计算机视觉的行为识别方法,所述方法包括:采用行为识别模型识别出任一目标监控视频中的若干动作类别,且将每一动作类别作为动作行为标签,基于预设背景模型,获取每一动作持续时间段对应的静态图像集,并进一步得到每一动作持续时间段对应的动作区域标签,获取每一动作持续时间段对应的初始场景描述文本并经过融合处理得到若干个目标场景描述文本,将每一目标场景描述文本均输入至预设分类模型中,得到事件分类结果,以判断目标监控视频中是否发生预设行为事件;本发明能够快速准确地识别出是否发生了预设行为事件,提高了预设行为事件的判定效率和准确性。
技术关键词
文本
时间段
识别方法
场景
图像
标签
预训练语言模型
视频
计算机视觉技术
像素点
指标
样本
动态
语义
因子
算法
关系
系统为您推荐了相关专利信息
金字塔池化模块
烟雾
电梯异常预警
预警系统
光照
文本
大语言模型
网络资源数据
计算机设备
计算机程序产品
表面缺陷图像
深度网络学习
钢材
表面缺陷检测
投影特征
风电叶片
深度学习模型
红外热像仪
分析方法
置信度阈值