摘要
本发明实施例提供了一种音视频匹配度预测方法,可以应用于计算机视觉和人工智能技术领域。该音视频匹配度预测方法包括:提取历史音视频数据生成音频客观特征数据和视频客观特征数据;基于预设典型相关性分析规则,生成音频客观特征数据对应的音频降维特征数据和视频客观特征数据对应的视频降维特征数据;通过音频降维特征数据、视频降维特征数据生成预设多任务网络模型对应的目标预测模型;基于目标预测模型对更新音视频数据执行预测,生成目标预测结果。本发明实施例还提供了一种音视频匹配度预测装置。
技术关键词
降维特征
音视频
感知特征
典型相关性分析
相关性分析模型
多任务
度预测方法
视频特征数据
音频特征数据
度预测装置
训练集数据
注意力
网络
深度卷积模型
样本
融合特征
标注规则
系统为您推荐了相关专利信息
预测模型训练方法
生成对抗网络
降维特征
特征提取模块
指标
语义
构建知识图谱
数据搜索方法
多模态
Dijkstra算法
身份
输出特征
数据分析方法
多尺度网络
投影特征