基于视觉语言对应的AI生成全景图像质量评价方法与系统

AITNT
正文
推荐专利
基于视觉语言对应的AI生成全景图像质量评价方法与系统
申请号:CN202510425337
申请日期:2025-04-07
公开号:CN119919423B
公开日期:2025-07-18
类型:发明专利
摘要
本发明提出一种基于视觉语言对应的AI生成全景图像质量评价方法与系统,该方法包括:获取AI生成全景图像,对AI生成全景图像进行采样;基于图像块集合,利用视觉编码器对图像块进行特征表示;利用语言编码器对AI生成全景图像附有的文本描述进行特征表示;对图像块的视觉特征与文本描述的文本特征依次进行L2归一化处理和余弦相似度计算;利用全连接网络和归一化函数对融合后的特征向量进行处理。本发明使用视觉语言对应分析,对AI生成全景图像以及其相对应的文本描述,两者联动分析,利用学习到的视觉语言对应关系,高效准确预测AI生成全景图像的质量分数。
技术关键词
生成全景图像 图像块 语言编码器 文本 评价方法 多模态特征融合 序列 视觉特征提取 模块 掩码矩阵 网络 评价系统 索引
系统为您推荐了相关专利信息
1
一种无人机射频信号识别方法、设备及介质
信号识别方法 无人机 信号识别模型 射频 图像编码器
2
合同审核方法、装置、电子设备、存储介质及程序产品
合同审核方法 关键字 计算机执行指令 风险 合规性
3
视频剪辑方法和装置
视频剪辑方法 视觉 视频剪辑装置 可读存储介质 计算机程序产品
4
资源额度处理方法及装置
资源 编辑 风险 控件 计算机可执行指令
5
语音生成方法、设备、介质和计算机程序产品
语音生成方法 声纹特征 时间感知模块 语音编解码器 意图
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号