摘要
本发明涉及全景图像质量评价领域,具体为基于多模态语义融合的全景图像质量评价方法和装置。所述方法包括根据目标失真全景图得到文本语义特征和全局视觉语义特征,再通过上述两个特征得到多模态全局语义特征;将目标失真全景图分为若干视口图,再提取每个视口的局部视觉语义特征,通过每个视口的局部视觉语义特征与文本语义特征得到每个视口的局部视觉语义特征,再将所有视口的局部视觉语义特征进行拼接,得到多模态局部语义特征;将多模态全局语义特征和多模态局部语义特征进行拼接,得到质量评价分数。以此方式,可以利用视觉语义特征和文本语义特征进行跨模态融合,能够获取丰富的模态间的语义交互关系,提高模型特征表示能力。
技术关键词
局部视觉语义
多模态
语义特征提取
全景图
注意力
跨模态
融合特征
视觉特征提取
特征提取模块
采样模块
评价方法
文本生成模型
图像
计算机
评价装置
系统为您推荐了相关专利信息
决策方法
斯塔克尔伯格博弈
动态知识图谱
节点
时间序列特征
无损检测方法
病害特征
噪声抑制模块
信号预处理模块
路面
可靠性测试方法
故障场景
集群
关键性能指标变化
评分算法
联邦学习技术
阶梯
强化学习框架
深度强化学习算法
企业
数据处理服务器
椎体
生成服务器
计算机断层扫描
多模态