摘要
本发明涉及图像识别的技术领域,提供了基于人工智能的视频目标识别方法、装置及存储介质,包括获取目标视频的视频帧数据序列,对视频帧数据序列进行多维分析,得到全局视频帧信息和局部感兴趣区域信息,基于全局视频帧信息和局部感兴趣区域信息生成目标特征图后进行时序模式分析,得到时序演化特征,结合生成语义表示向量,将语义表示向量输入预设的自适应Transformer模型进行目标识别,得到目标识别结果。通过特征融合生成语义表示向量,并利用自适应Transformer模型进行目标识别,提升复杂场景下的目标识别精度,改善在处理复杂场景、动态变化和长时间序列分析时,存在着检测精度不高、时序信息利用不足的问题。
技术关键词
局部感兴趣区域
视频帧信息
演化特征
识别方法
多层注意力机制
多头注意力机制
矩阵
图谱
语义
时序特征
序列
节点特征
聚类特征
拓扑特征
空间特征分析
系统为您推荐了相关专利信息
缺陷位置信息
识别设备
缺陷识别方法
AI服务器
标识
行人重识别模型
人体关键点
重识别方法
双分支网络
姿态估计
场景意图
意图识别
识别方法
大语言模型
识别系统
风机叶片
损伤识别模型
神经网络模型
损伤识别方法
损伤识别装置
意图识别模型
模态特征
智能客服
分层识别方法
多模态交互