摘要
本申请实施例提供了一种三维流媒体视频质量评估方法、装置、设备及存储介质,属于图像处理技术领域。该方法包括:获取待评估的初始三维流媒体视频;从初始三维流媒体视频中提取目标对象的二维视频信息,并从初始三维流媒体视频中提取音频信息;基于多个不同类型的多模态大模型,分别对二维视频信息进行质量评估处理,并对质量评估处理后得到的多个评估特征进行融合得到视频特征;比较二维视频信息和音频信息的一致性得到音画同步特征,并对音频信息进行短时分析处理得到音频特征;基于视频特征、音画同步特征和音频特征,对初始三维流媒体视频进行质量回归分析,得到目标质量评分。本申请能够提高对三维流媒体视频质量评估的准确率和效率。
技术关键词
视频
音频特征
音唇同步
多模态
误差距离
对象
可读存储介质
图像处理技术
同步误差
评估装置
坐标系
波形
电子设备
语音
处理器
人脸
模块
记忆