摘要
本发明提供了一种对象描述信息的确定方法、装置、电子设备和存储介质。该方法包括:获取视频的M个第一视频帧,每个所述第一视频帧中包括目标对象,M为正整数;利用第一模型对每一所述第一视频帧中的所述目标对象进行识别,获得第一集合,所述第一集合包括每一所述第一视频帧包含的所述目标对象的属性信息,所述属性信息用于表征所述目标对象的形象特征,所述第一模型是用于对目标对象的N个形象特征进行识别的模型;将所述第一集合输入第二模型进行自然语言处理,获得所述目标对象的文本描述信息,所述文本描述信息用于表示所述目标对象的形象特征的文本描述。
技术关键词
视频帧
自然语言
文本
图像
通信接口
电子设备
处理器
存储器
分类方式
对象检测
计算机程序产品
语义
注意力机制
元素
识别模块
可读存储介质