摘要
本发明一种基于六自由度信息引导的沉浸式视频质量评价方法及装置,涉及计算机视觉领域,方法包括:构建基于六自由度信息引导的沉浸式视频质量评价模型并训练,得到经训练的评价模型;从沉浸式视频提取纹理视频块、纹理关键帧和深度关键帧;将纹理视频块、纹理关键帧和深度关键帧输入经训练的评价模型,通过视觉信息编码模块提取到对应的视觉特征;将视觉特征输入时空映射模块得到时间视觉标记和空间视觉标记;通过语言编码器对指令信息和六自由度视点位置信息进行编码,得到文本指令标记和视点位置标记;将各标记进行组合得到组合标记,将组合标记输入语音解码器中,得到沉浸式视频质量分数。本发明能够准确客观评估沉浸式视频的质量。
技术关键词
沉浸式视频
关键帧
语言编码器
视频块
纹理
标记
语音解码器
视觉特征
大语言模型
信息编码
指令
评价方法
文本
模块
处理器
计算机程序产品
评价装置
系统为您推荐了相关专利信息
山火监测方法
卷积神经网络模型
深度学习模型
山火监测装置
深度学习特征
安防监控大数据处理方法
视频监控数据
异常事件
联动应急系统
大数据处理系统
果实
坐标系
定位方法
多头注意力机制
原始图像数据
虚拟修复方法
陶器
纹理映射技术
三维模型
计算机视觉算法