摘要
本发明涉及一种基于辅助意见的零样本视频质量评价方法,属于计算机视觉领域。包括:对视频时间下采样,计算空间自然分数;对同样视频空间下采样,计算出时间自然分数,将空间自然分数、时间自然分数分别经过高斯归一化和Sigmoid函数重新缩放;将对抗性语言‑图像预训练模型CLIP在图像质量评价数据集上进行微调,并添加场景和失真类型的标签,建立文本提示,使文本提示与图像对应的特征建立对应关系;对视频时空下采样,嵌入经过微调后的CLIP,提取视频整体相关的高级语义特征,使用CLIP预测文本建议质量分数,并通过高斯归一化和Sigmoid函数重新缩放对齐分数;将计算出的时间自然分数、空间自然分数和文本建议质量分数相加,得到更全面的视频质量分数。
技术关键词
视频
评价方法
计算机程序指令
文本
样本
预训练模型
感知特征
语义特征
对抗性
处理器
场景类别
计算机视觉
评价系统
图像编码
指标
标签
景观
系统为您推荐了相关专利信息
预训练模型
计算机设备
参数
电力系统
数据获取模块
隧道模型试验
探头外壳
激光雷达
摄影机
扫描控制信号
信息抽取方法
预训练模型
搜素方法
事件触发词
模型超参数