摘要
本发明公开一种基于内容和失真双语义指导的无参考图像质量评价模型构建方法,利用视觉语言对比学习的预训练模型CLIP,设计了内容文本描述和失真文本描述两种语义描述模型,由CNN和Transformer两个分支分别提取图像的内容特征与失真特征,将图像的失真特征与失真类型及质量等级文本描述特征进行余弦相似度计算,获取图像与各类失真类型和质量等级的匹配概率;将质量等级概率结合李克特量表预测质量分数;分别计算内容类型、失真类型、质量分数损失,加权求和以指导模型训练。充分结合了人类视觉系统在质量感知中对语义内容敏感性特征,有效增强了模型在复杂失真情境下的语义理解能力与质量评估准确性。
技术关键词
模型构建方法
文本
图像失真
语义
编码器
注意力机制
语句
图像内容特征
量表
敏感性特征
人类视觉系统
模板
感知特征
定义
残差网络
计算机
图像块
系统为您推荐了相关专利信息
注意力机制
图像分割方法
静脉
尺寸
图像分割系统
网络设备管理方法
人工智能深度学习
人工智能算法
波特率
聚类