基于概念场景图与大模型融合的主动视觉感知方法与系统

正文

推荐专利

申请号：CN202510801596

申请日期：2025-06-16

公开号：CN120932215A

公开日期：2025-11-11

类型：发明专利

摘要

本发明属于机器人感知领域，提供了一种基于概念场景图与大模型融合的主动视觉感知方法与系统。其中，方法包括基于设定场景的图像，提取其中的候选实体及其文本描述和空间关系；从用户指令中提取目标实体，计算目标实体文本描述与候选实体之间的视觉‑语言对齐匹配分数，以匹配分数最高的候选实体为主节点构建概念场景图；利用嵌入有三元提示工程的大模型对概念场景图进行处理，结合成功的历史任务策略代码，生成当前任务场景的策略代码，以使得机器人主动感知场景中的隐式信息，实现被遮挡且存在视觉混淆的目标实体的识别与抓取。

技术关键词

视觉感知方法实体场景概念文本属性匹配机器人预训练模型视觉感知系统图像策略模块关系处理器计算机设备节点可读存储介质指令存储器

系统为您推荐了相关专利信息

差异化并发业务跨域通信方法及装置

跨域通信方法数学模型变量时延业务分配

基于伪反馈和注意力机制的供电问答方法、装置、设备及介质

阅读理解模型问答方法注意力机制注意力模型 BERT模型

数据压缩方法、数据解压方法、装置、芯片、车辆与介质

数据解压方法数据压缩方法网络结构系统级芯片解码器

一种机器视觉灰度仪应用中对多种场景的测量优化方法

彩色图像反射率包裹相机 3D点云

空调控制方法、装置、空调及存储介质

风速空调控制方法分层姿态识别模型空调控制模块

基于概念场景图与大模型融合的主动视觉感知方法与系统

站点导航

APP 下载