摘要
本申请公开了一种视频彩铃标签生成方法、系统、设备及介质,方法包括:获取多模态视频彩铃数据,对多模态视频彩铃数据进行预处理得到预处理数据,对预处理数据进行时空特征提取处理得到视频时空特征,对视频时空特征进行多模态特征融合处理得到多模态特征,构建动态语义图谱,根据动态语义图谱对多模态特征进行标签查询处理,得到视频彩铃标签。本申请实施例能够提高标签与内容语义的一致性,可以广泛应用于视频处理技术领域。
技术关键词
视频时空特征
视频彩铃
语义图谱
多模态特征融合
标签生成方法
傅里叶变换处理
光流场
数据
图像
动态背景
视频流
标签生成系统
文本检测模型
视觉特征