摘要
本发明实施例提供了一种全景场景图生成方法、装置、设备以及存储介质,该方法包括:对指定图像进行分析,得到关系提议文本特征以及关系判断文本特征;对指定图像进行处理,得到视觉特征、物体类别以及掩码;将视觉特征分别与关系提议文本特征、关系判断文本特征进行融合;对视觉特征与关系提议文本特征融合后得到的特征进行解码,得到关系提议预测结果;对视觉特征与关系判断文本特征融合后得到的特征进行解码,得到关系判断预测结果;将两类预测结果进行融合,得到关系预测结果;结合关系预测结果、物体类别以及掩码,生成全景场景图。以此方式,可以在丰富文本信息的辅助下,实现更准确的关系预测,进而生成无偏的全景场景图。
技术关键词
视觉特征
关系
文本
生成全景
生成方法
解码器
物体
场景
图像分割模型
特征数据库
计算机
注意力
解码模块
电子设备
处理器通信
生成装置
指令
系统为您推荐了相关专利信息
眼球模型
人脸姿态
计算机设备
关系
图像采集装置
抽水蓄能电站
参数计算方法
机器学习模型
模拟模型
数字高程模型
生成方法
执行测试用例
测试场景
语义向量
计算机程序产品
图谱
智能解析系统
实体
Louvain算法
Apriori算法