摘要
本发明提出一种基于视觉语言对应的AI生成全景图像质量评价方法与系统,该方法包括:获取AI生成全景图像,对AI生成全景图像进行采样;基于图像块集合,利用视觉编码器对图像块进行特征表示;利用语言编码器对AI生成全景图像附有的文本描述进行特征表示;对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算;利用全连接网络和归一化函数对融合后的特征向量进行处理。本发明使用视觉语言对应分析,对AI生成全景图像以及其相对应的文本描述,两者联动分析,利用学习到的视觉语言对应关系,高效准确预测AI生成全景图像的质量分数。
技术关键词
生成全景图像
图像块
语言编码器
文本
评价方法
多模态特征融合
序列
视觉特征提取
模块
掩码矩阵
网络
评价系统
索引
系统为您推荐了相关专利信息
信号识别方法
无人机
信号识别模型
射频
图像编码器
合同审核方法
关键字
计算机执行指令
风险
合规性
视频剪辑方法
视觉
视频剪辑装置
可读存储介质
计算机程序产品
语音生成方法
声纹特征
时间感知模块
语音编解码器
意图