基于视觉语言对应的AI生成全景图像质量评价方法与系统

正文

推荐专利

申请号：CN202510425337

申请日期：2025-04-07

公开号：CN119919423B

公开日期：2025-07-18

类型：发明专利

摘要

本发明提出一种基于视觉语言对应的AI生成全景图像质量评价方法与系统，该方法包括：获取AI生成全景图像，对AI生成全景图像进行采样；基于图像块集合，利用视觉编码器对图像块进行特征表示；利用语言编码器对AI生成全景图像附有的文本描述进行特征表示；对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算；利用全连接网络和归一化函数对融合后的特征向量进行处理。本发明使用视觉语言对应分析，对AI生成全景图像以及其相对应的文本描述，两者联动分析，利用学习到的视觉语言对应关系，高效准确预测AI生成全景图像的质量分数。

技术关键词

生成全景图像图像块语言编码器文本评价方法多模态特征融合序列视觉特征提取模块掩码矩阵网络评价系统索引

系统为您推荐了相关专利信息

一种无人机射频信号识别方法、设备及介质

信号识别方法无人机信号识别模型射频图像编码器

合同审核方法、装置、电子设备、存储介质及程序产品

合同审核方法关键字计算机执行指令风险合规性

视频剪辑方法和装置

视频剪辑方法视觉视频剪辑装置可读存储介质计算机程序产品

资源额度处理方法及装置

资源编辑风险控件计算机可执行指令

语音生成方法、设备、介质和计算机程序产品

语音生成方法声纹特征时间感知模块语音编解码器意图

基于视觉语言对应的AI生成全景图像质量评价方法与系统

站点导航

APP 下载