摘要
本发明实施例提供一种三维场景图谱中物体节点信息的生成方法及系统,属于智能体场景感知领域。该方法包括:针对与物体节点相关的观测帧,利用视觉语言模型生成每一帧的属性描述信息;分别获取每一帧描述的文本编码向量和当前帧图像的图像编码向量;确定文本编码向量和图像编码向量之间的余弦相似度,并选取相似度最高的一帧描述作为当前帧修正后的描述;融合修正后的观测帧描述,并利用大语言模型得到物体节点的节点信息。通过挖掘智能体场景感知信息中的时空线索,生成和完善三维场景图谱中的节点信息,减少错误描述的影响,助力智能体实现对场景的精确感知,从而提升智能体在环境感知、自主导航、智能决策和适应环境变化方面的能力。
技术关键词
编码向量
节点
生成方法
图谱
场景
物体
大语言模型
层级
非暂态计算机可读存储介质
生成系统
实体
视觉
文本编码器
图像编码器
处理器
存储器
线索
系统为您推荐了相关专利信息
物料清单数据
自动编码方法
条目
数据挖掘算法
统一数据结构
电网故障诊断方法
混合网络
GCN模型
空间拓扑结构
电网拓扑结构
智慧园区管理
智能化算法
链条
子模块
通风排气装置