一种基于思维链推理的全景视觉关系检测方法

AITNT
正文
推荐专利
一种基于思维链推理的全景视觉关系检测方法
申请号:CN202510752509
申请日期:2025-06-06
公开号:CN120655919A
公开日期:2025-09-16
类型:发明专利
摘要
本发明提供一种基于思维链推理的全景视觉关系检测方法,在思维链推理过程中引入了图像描述技术,使模型能够同时根据生成的描述信息和图像信息进行目标检测和相互验证,相比现有技术增加了后验环节,提高了目标检测的效果和可靠性,并且能够让生成的关系更符合实际描述;同时,本发明在全景分割的基础上进行关系检测,能够同时实现目标识别和视觉关系检测,与现有技术相比,对图片内目标与存在关系的挖掘程度更高;最后,本发明能够通过零样本或小样本实现基于全景分割的视觉关系检测,不需要通过大量数据进行训练即可取得不错的关系检测结果。
技术关键词
视觉关系检测方法 图像 椅子 格式 修复工具 字段 冗余 符号 地面 样本 字符 图片 颜色 算法 接口 基础 数据
系统为您推荐了相关专利信息
1
基于智能分层渲染的实时游戏图像优化方法
游戏图像 复杂度 场景 指数 机器学习模型
2
一种遥感影像域适应语义分割方法、可读存储介质及设备
语义分割模型 语义分割方法 原型 偏差 代表
3
一种用于深基坑掘进的深基坑裂缝检测方法及设备
深基坑 运动向量 图像采集装置 像素点 图像分析模块
4
一种基于机器视觉的机械臂智能控制方法、系统及介质
焊点 序列 角度偏差值 滑动窗口 边缘轮廓
5
传感器标定方法、机器人、存储介质、设备和程序产品
坐标系 传感器标定方法 图像传感器 激光传感器 动态传感器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号