摘要
本发明提供一种基于思维链推理的全景视觉关系检测方法,在思维链推理过程中引入了图像描述技术,使模型能够同时根据生成的描述信息和图像信息进行目标检测和相互验证,相比现有技术增加了后验环节,提高了目标检测的效果和可靠性,并且能够让生成的关系更符合实际描述;同时,本发明在全景分割的基础上进行关系检测,能够同时实现目标识别和视觉关系检测,与现有技术相比,对图片内目标与存在关系的挖掘程度更高;最后,本发明能够通过零样本或小样本实现基于全景分割的视觉关系检测,不需要通过大量数据进行训练即可取得不错的关系检测结果。
技术关键词
视觉关系检测方法
图像
椅子
格式
修复工具
字段
冗余
符号
地面
样本
字符
图片
颜色
算法
接口
基础
数据
系统为您推荐了相关专利信息
深基坑
运动向量
图像采集装置
像素点
图像分析模块
坐标系
传感器标定方法
图像传感器
激光传感器
动态传感器