摘要
本发明涉及视频分析领域,具体为一种基于音视频特征交互融合的视频质量评价方法和装置。所述方法包括获取原始数据集,原始数据集包括视频数据和音频数据;对原始数据集进行预处理,得到视频帧数据和音频频谱数据;将视频帧数据输入视频特征提取模型,得到视频帧特征;将音频频谱数据输入音频特征提取模型,得到音频帧特征;将视频帧特征和音频帧特征输入特征交互融合模型,得到音视频交互融合帧特征;将音视频交互融合帧特征输入质量评价模型,输出音视频的质量评价分数,将音视频的质量评价分数作为视频质量评价结果。以此方式,可以充分利用视频的音视频语义特征和交互关系,更能准确地评估视频质量。
技术关键词
视频帧特征
图像块特征
音视频交互
融合特征
视频特征提取
音频特征提取
数据
评价方法
分支
特征提取模块
视频分析
评价装置
处理器
系统为您推荐了相关专利信息
姿态预测方法
循环注意力机制
交互特征
动作协同
融合特征
图像识别方法
语义特征
融合特征
多尺度特征提取
输出特征
时空注意力机制
空间特征信息
多层感知机
融合多尺度信息
特征提取模块
电力抢修车
融合特征
车辆识别模型
电缆终端
识别方法
三维点云重建方法
融合点云数据
三维点云数据
相机
训练样本数据