摘要
本发明涉及计算机视觉技术领域,具体涉及一种基于注意力与可变形卷积的图像色差度量方法。包括利用CNN和VIT分别提取参考图像和失真图像的局部特征和全局语义特征;通过可变形卷积进行注意力引导,利用VIT的全局语义特征引导CNN关注图像的显著区域;将经过注意力引导的CNN特征和VIT全局语义特征进行融合;利用高频预测和低频预测双分支进行分数预测,并采用加权求和融合低频预测得分和高频预测得分,获取失真图像最终得分。该技术方案能够保证度量方法的结果与人类的感知结果具有一致性。
技术关键词
注意力
语义特征
色差
度量
位置编码信息
分支
计算机视觉技术
前馈神经网络
图像块
编码器
图像分割
双线性
代表
通道
补丁
字段
批量
网格
人类
系统为您推荐了相关专利信息
多源异构数据
编码器
高斯混合模型
融合特征
惯性传感单元
时间序列预测模型
频谱特征提取
数据
序列预测方法
网络
轨迹分类方法
轨迹分类模型
深度卷积神经网络
双向长短期记忆网络
动态图像信息