摘要
本申请实施例提供了一种视频背景物体识别方法和装置、电子设备及存储介质,属于图像处理和人工智能技术领域。该方法包括:获取包含背景图像的当前视频流数据;基于当前视频流数据,对背景图像进行物体识别,得到视频模态物体类别数据;对当前视频流数据进行视频抽帧,得到视频帧数据;对视频帧数据进行进行图像分割,得到图像模态物体类别数据;基于视频帧数据,对背景图像进行文本描述,得到背景描述文本;对背景描述文本进行命名实体识别,得到文本模态物体类别数据;基于视频模态物体类别数据、图像模态物体类别数据及文本模态物体类别数据,对当前视频流数据进行背景物体类别识别。本申请实施例能够提高视频背景物体的识别准确率。
技术关键词
视频帧
物体识别方法
视频背景
视频流
文本
数据
命名实体识别
图像分割
图像特征提取
上下文语义理解
实例分割
物体识别装置
序列
电子设备
全局特征提取
局部特征提取
注意力
系统为您推荐了相关专利信息
数据核查方法
文本特征向量
非易失性存储介质
指标
序列
认证数据管理方法
查询关键词
预训练语言模型
评分算法
发起网页请求
智能算法
深度学习分析
数据采集模块
数据存储单元
分析模块